CN111670470B - 尤其是为了操控建筑物中的房间操作元件而提供基于语音的服务的方法和系统 - Google Patents
尤其是为了操控建筑物中的房间操作元件而提供基于语音的服务的方法和系统 Download PDFInfo
- Publication number
- CN111670470B CN111670470B CN201980012359.1A CN201980012359A CN111670470B CN 111670470 B CN111670470 B CN 111670470B CN 201980012359 A CN201980012359 A CN 201980012359A CN 111670470 B CN111670470 B CN 111670470B
- Authority
- CN
- China
- Prior art keywords
- asb
- voice
- service
- instructions
- building
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000004891 communication Methods 0.000 claims description 14
- 238000012546 transfer Methods 0.000 claims description 7
- 238000010295 mobile communication Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 description 12
- 238000003058 natural language processing Methods 0.000 description 11
- 239000003795 chemical substances by application Substances 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 8
- 102100033897 Ankyrin repeat and SOCS box protein 1 Human genes 0.000 description 7
- 101000925496 Homo sapiens Ankyrin repeat and SOCS box protein 1 Proteins 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 102100021626 Ankyrin repeat and SOCS box protein 2 Human genes 0.000 description 6
- 101000754299 Homo sapiens Ankyrin repeat and SOCS box protein 2 Proteins 0.000 description 6
- GWEVSGVZZGPLCZ-UHFFFAOYSA-N Titan oxide Chemical compound O=[Ti]=O GWEVSGVZZGPLCZ-UHFFFAOYSA-N 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 102100021619 Ankyrin repeat and SOCS box protein 5 Human genes 0.000 description 5
- 101000754309 Homo sapiens Ankyrin repeat and SOCS box protein 5 Proteins 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 102100021625 Ankyrin repeat and SOCS box protein 3 Human genes 0.000 description 3
- 102100021617 Ankyrin repeat and SOCS box protein 4 Human genes 0.000 description 3
- 102100021618 Ankyrin repeat and SOCS box protein 6 Human genes 0.000 description 3
- 102100021623 Ankyrin repeat and SOCS box protein 7 Human genes 0.000 description 3
- 101000754296 Homo sapiens Ankyrin repeat and SOCS box protein 3 Proteins 0.000 description 3
- 101000754303 Homo sapiens Ankyrin repeat and SOCS box protein 4 Proteins 0.000 description 3
- 101000754305 Homo sapiens Ankyrin repeat and SOCS box protein 6 Proteins 0.000 description 3
- 101000754271 Homo sapiens Ankyrin repeat and SOCS box protein 7 Proteins 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 102100031020 5-aminolevulinate synthase, erythroid-specific, mitochondrial Human genes 0.000 description 2
- 101710115247 Arylsulfatase B Proteins 0.000 description 2
- 241000238558 Eucarida Species 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001010 compromised effect Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 101100164120 Caenorhabditis elegans asb-2 gene Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000004313 glare Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C17/00—Arrangements for transmitting signals characterised by the use of a wireless electrical link
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y10/00—Economic sectors
- G16Y10/80—Homes; Buildings
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y40/00—IoT characterised by the purpose of the information processing
- G16Y40/30—Control
- G16Y40/35—Management of things, i.e. controlling in accordance with a policy or in order to achieve specified objectives
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K1/00—Secret communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0407—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the identity of one or more communicating identities is hidden
- H04L63/0421—Anonymous communication, i.e. the party's identifiers are hidden from the other party or parties, e.g. using an anonymizer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42008—Systems for anonymous communication between parties, e.g. by use of disposal contact identifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/02—Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/043—Time compression or expansion by changing speed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K1/00—Secret communication
- H04K1/04—Secret communication by frequency scrambling, i.e. by transposing or inverting parts of the frequency band or by inverting the whole band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K1/00—Secret communication
- H04K1/06—Secret communication by transmitting the information or elements thereof at unnatural speeds or in jumbled order or backwards
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Civil Engineering (AREA)
- Architecture (AREA)
- Structural Engineering (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Computer Hardware Design (AREA)
- Automation & Control Theory (AREA)
- Telephonic Communication Services (AREA)
Abstract
用于尤其是为了操控建筑物中的房间操作元件而提供基于语音的服务的方法和系统,其中通过音频设备接收语音指令,其中所述音频设备设立为,对接收到的语音指令进行分析,将接收到的语音指令转换成相对应的针对房间操作元件的操作命令,以操控建筑物中的尤其是HVAC设备(例如现场设备),并且转交给相对应的房间操作元件;而且其中在音频设备处接收到语音指令之前,通过匿名化服务将所述语音指令的发送方(用户)的身份匿名化。
Description
技术领域
本发明涉及一种用于尤其是为了操控(Ansteuerung)建筑物中的房间操作元件而提供基于语音的服务的方法和系统。此外,本发明涉及一种计算机可读的存储介质和一种计算机程序产品,它存储如下指令:当所述指令由计算机实施时,所述指令促使计算机执行用于尤其是为了操控建筑物中的房间操作元件而提供基于语音的服务的方法。
背景技术
智能音频设备(如例如Amazon Echo(亚马逊回声)或者Google Home(谷歌家))使得用户能够与相对应的虚拟助理或语音助理(如例如亚马逊公司的Alexa或者苹果公司的Siri)合作地通过语音指令或语音命令来控制与之连接的设备。语音指令或语音命令或者其序列被分析、被评估,并且在相对应的设备处引起相对应的反应。例如“接通起居室中的灯”。
智能音频设备在此是如下设备:所述设备使用“人工智能(ArtificialIntelligence)”引擎(Künstliche Intelligenz (KI)-Engine)软件,所述软件学习用户的行为、习惯和偏好,并且这样也可以为用户供应个体适配的建议、解决方案或者动作。但是,这要求由用户泄漏个体的和与人有关的数据,所述数据典型地在用户的控制和影响范围之外被处理、被分析并且与人有关地被存储。
出于数据保护的原因,智能音频设备的采用因此只在私人家庭(Privathaushalt)中或只在私人生活中是可能的,因为个人自己已明确地(dezidiert)决定在他的处所之内采用这类语音服务。而在非私人家庭(如例如企业)中,使用这类语音控制极度危险,因为在一般情况下大量人使用该服务,这些人还没有给予(有时候还可能不会给予)针对与人有关地使用他们的数据的正式同意。
发明内容
因而,本发明的任务是提供一种方法和一种系统,它使得能够在考虑数据保护的情况下在非私人家庭(如例如企业)中也使用基于语音的服务。
该任务通过一种用于尤其是为了操控建筑物基础设施技术而提供基于语音的服务的方法来解决,该方法包括:
通过音频设备接收语音指令,其中该音频设备设立为,对接收到的语音指令进行分析,将接收到的语音指令转换成相对应的操作命令,以操控建筑物中的设备(例如现场设备)和/或程序,并且转交给相对应的房间操作元件或者直接转交给相应的建筑物基础设施技术;
其中在通过相对应的语音识别服务(例如援助服务(Assistenzdienst))评估语音指令之前,通过单独的和值得信赖的匿名化服务将语音指令的发送方的身份匿名化。匿名化尤其允许在遵守数据保护的情况下使用援助服务。通过匿名化,遮掩实际询问方的身份,但是实际的系统控制(Anlagensteuerung)不受语音损害。有利地,音频设备起用于匿名化服务的代理(Proxy)的作用。
接收到的语音指令的匿名化可以通过音频设备本身进行,或者通过与音频设备连接的值得信赖的(trustworthy)服务器(例如本地服务器)进行。经过匿名化的语音指令可以由外部的(可能也是不值得信赖的(non-trustworthy))服务器来接受、分析,并且作为相对应的用于操控设备(例如现场设备)或者程序(例如建筑物管理站或者房间操作元件的程序)的操作命令来转交。
本发明的第一有利的设计方案在于,通过经过随机化的语音异化(Sprachverfremdung)进行匿名化。这例如可以通过失真器进行,所述失真器引起原始语音命令的变形(例如改变音区和/或语速),所述原始语音命令的变形阻止与人有关的关联(Zuordnung)。经过随机化的语音异化在此可以在音频设备中(通过相对应的硬件或者软件部件)进行。原则上,在相对应的服务供应商或虚拟助理(也就是提供数字语音分析的相对应的服务)被调用之前,经过随机化的语音异化但是也可以在任何另外的值得信赖的部位处进行。经过随机化的语音异化引起由用户发出的语音命令的熵的提高。
本发明的其他有利的设计方案在于,进行匿名化,使得在发送方(用户)与匿名化服务之间存在可追溯性,但是在发送方与音频设备之间不存在可追溯性。音频设备和虚拟助理的相对应的供应方因此不能将接收到的语音命令追溯到发送方(用户),并且也不能辨认出所述发送方(用户)。语音命令的发送方(用户)因此对于音频设备和虚拟助理而言是不透明的。虚拟助理的供应商因此不能评估用户的任何与人有关的数据。可追溯性仅在发送方(用户)与匿名化服务之间存在。仅仅连接在音频设备和/或虚拟助理的上游的匿名化服务能够或设立为,评估用户的与人有关的数据,或者给出对用户的相应的语音命令的与用户有关的语音响应(例如反馈(Feedback))。在本发明的该设计方案中,针对匿名化服务的用户生成响应或反馈。
本发明的其他有利的设计方案在于,基于对接收到的语音指令的分析,音频设备生成如下反馈:所述反馈由匿名化服务与专用的发送方关联。在本发明的该设计方案中,对语音指令的响应或反馈尽管由音频设备或由虚拟助理生成,但是对于音频设备或值得信赖的匿名化服务而言最多(并且也只有当明确想要时)可能的是,将识别出的语音指令关联至该语音指令的真实的讲话者,但是对于(不值得信赖的)虚拟助理/语音服务供应商,这是不可能的。
此外,该任务通过一种用于尤其是为了操控建筑物中的房间操作元件(RBE)而提供基于语音的服务的系统来解决,该系统包括:
值得信赖的匿名化服务,该匿名化服务设立为,接收发送方的语音指令,并且对所述语音指令进行转换,使得语音指令的发送方的身份匿名化,其中匿名化服务进一步设立为,针对音频设备、尤其是不值得信赖的音频设备提供经过匿名化的语音指令;
音频设备、尤其是不值得信赖的音频设备,用于接收经过匿名化的语音指令,其中音频设备设立为,对接收到的语音指令进行分析,将接收到的语音指令转换成相对应的操作命令,以操控建筑物中的设备(例如HVAC设备或者现场设备)和/或程序(例如针对建筑物管理站的程序),并且转交给所述设备和/或程序。匿名化服务例如可以在音频设备中实现(如果所述音频设备可以被分类为值得信赖的),或者在置于相对应的虚拟助理的上游的值得信赖的代理上(例如在建筑物本身中或者在值得信赖的服务供应商处)实现。匿名化服务可以将接收到的语音消息(或者语音指令)例如通过语音失真转换成经过匿名化的语音消息。但是也可能的是,由匿名化服务将接收到的语音消息转换成(有利地内部的)文本。该文本接着通过针对援助服务(例如Amazon Alexa)的匿名化服务的语音生成器来输出。通过匿名化来确保,不再能够推断出已放出(abgesetzt)原始语音消息(或者语音指令)的人。
本发明的其他有利的设计方案在于,匿名化服务在用户(发送方)的相对应配备的移动通信终端设备上实现。但是也可能的是,例如通过App将匿名化服务安装在用户的移动通信终端设备上。这例如可以通过从相对应的服务供应商的互联网平台下载来进行。
本发明的其他有利的设计方案在于,在音频设备中集成有匿名化服务。有利地,在该设计方案中,音频设备事先已被分类为值得信赖的。在该设计方案中,匿名化服务嵌入(embedded)在音频设备中。匿名化服务例如可以嵌入到音频设备的相对应的处理逻辑(例如微处理器)中,例如作为软件或者作为固件来嵌入。
本发明的其他有利的设计方案在于,匿名化服务作为值得信赖的网络部件(代理)在建筑物通信网络(例如安装总线,KNX)中实现,并且其中音频设备是建筑物通信网络的其他值得信赖的网络部件。建筑物自动化系统因此可以非常容易地被装有或者被补充装有匿名化服务。有利地,匿名化服务作为网络部件被集成到建筑物通信网络的基础设施中。有利地通过无线电连接。
本发明的其他有利的设计方案在于计算机可读的存储介质,所述存储介质存储如下指令:当所述指令由计算机实施时,所述指令促使计算机执行用于尤其是为了操控建筑物中的设备或者为了操控建筑物中的程序而提供基于语音的服务的方法,其中所述方法包括:
提供匿名化服务,所述匿名化服务对用户的接收到的语音指令进行转换,使得所述语音指令的用户的身份被匿名化,其中匿名化服务向援助服务输出经过匿名化的语音指令;和
提供援助服务,以接收经过匿名化的语音指令,其中援助服务对接收到的经过匿名化的语音指令进行分析,将接收到的经过匿名化的语音指令转换成相对应的操作命令,以操控建筑物中的设备和/或以操控建筑物中的程序,并且转交给所述设备和/或所述程序。有利地,在非易失性的计算机可读的存储介质或者存储器上提供用于实施该方法和/或该系统的指令,所述存储介质或者存储器如缓存、缓冲器、RAM、可替换存储介质、硬盘、SD卡、CD、USB存储棒或者另外的计算机可读的存储介质。计算机可读的存储介质可以是不同类型的易失性的和非易失性的存储介质。响应于一个或者多个指示组来实施在本说明书中和在附图中所描述的功能或者方法步骤,所述指示存储在计算机可读的存储介质中或者存储在计算机可读的存储介质上。功能或者方法步骤与特定类型的指令组、存储介质、处理器或者处理策略无关,并且可以通过软件、硬件、固件等单独地或者组合地来实施。
本发明的其他有利的设计方案在于一种计算机程序产品,所述计算机程序产品包含在计算机上可实施的指令,当所述指令由计算机实施时,所述指令促使计算机执行用于尤其是为了操控建筑物中的设备或者为了操控建筑物中的程序而提供基于语音的服务的方法,所述方法包括:
提供匿名化服务,所述匿名化服务对用户的接收到的语音指令进行转换,使得语音指令的用户的身份被匿名化,其中匿名化服务向援助服务输出经过匿名化的语音指令;和
提供援助服务,以接收经过匿名化的语音指令,其中援助服务对接收到的经过匿名化的语音指令进行分析,将接收到的经过匿名化的语音指令转换成相对应的操作命令,以操控建筑物中的设备和/或以操控建筑物中的程序,并且转交给所述设备和/或所述程序。有利地,计算机程序产品构造为库和/或构造为其他计算机程序产品的程序模块。有利地,计算机程序产品通过软件或者固件以合适的编程语言来实施。有利地,计算机程序产品嵌入到计算机系统或者基于计算机的基础设施中。
附图说明
以随后的附图为例,阐述了本发明以及本发明的有利的实施方案。在此:
图1示出了用于提供基于语音的服务的第一示例性系统,所述第一示例性系统包括匿名化服务,
图2示出了用于提供基于语音的服务的第二示例性系统,所述第二示例性系统包括匿名化服务,
图3示出了用于提供基于语音的服务的第三示例性系统,所述第三示例性系统包括匿名化服务,
图4示出了示例性的匿名化服务,和
图5示出了用于提供基于语音的服务的方法的示例性流程图,其包括匿名化服务。
具体实施方式
为了数字智能个人助理有意义地并且按照规定地正常运转,这种服务的用户必须泄漏许多自身的个人数据。个体的责任致力于判定准备好放弃多少隐私。尤其是在非独立的工作的环境中(例如在企业中的工作岗位处),雇主例如出于数据保护原因或者出于雇佣法规定的义务而必须采取关于这一点的保护措施。如果雇主在此对事物限制过多,则雇员的满意度或接受度下降。雇主必须找出途径来提供期望的和习以为常的舒适特征(在该情况下为基于语音的数字助理),而不侵犯他的目标和义务。
智能个人助理(IPA)(或者:语音助理)是一种软件,该软件尤其将语音识别和语音分析、信息的搜索或者简单任务的处置和接着自然语音应答的合成连接在一起。目标是,在应用方与系统或者设备之间能够实现直观的接口,以便可以“以更人类的方式”表达命令或者搜索询问,(来自维基百科(Wikipedia))。
大型供应商的已知的服务例如是Microsoft Cortana、Amazon Alexa、Apple Siri或者Google Assistent。目前,要么经由通信终端设备(例如笔记本电脑、智能电话、平板电脑)要么经由专用辅助硬件(例如Amazon Echo或者Google Home)来使用这些服务。应用方经由语音和这种硬件部件向处于其后的“后端(backend)”传送命令。例如,可以进行在线传输至一个或者多个服务器。在那里,分析、评估语音指令,并且生成对该命令的相对应的反应。这种反应例如可以是语音应答,抑或是传送的动作。作为实例,要实施指令“接通起居室中的灯”。作为对该指令的反应,处于其后的服务器可能会向与询问方ID关联的房间操作元件传送控制指令,例如向所链接的灯控制装置传送控制指令。为了这从服务供应商方面是可能的,服务供应商必须知道该命令准确地来自于谁。此外,将该实例中提到的房间操作元件与该身份链接。
服务供应商的所谓的“人工智能”引擎(例如KI软件、如神经网络)学习使用者的行为、习惯、偏好,并且这样可以供应个体适配的建议、解决方案或者动作。对于服务供应商而言,使用者是透明的客户。此处,有利于个人舒适获益,也放弃数据保护和隐私。但是,在私人领域中(例如在自己的家中或者在自己的寓所中)可能和允许的事物但是在(尤其是具有多个雇员的)企业中由于法律的和/或内部的规则而被禁止,因为例如也可能经由智能个人助理(IPA)传输公司机密数据。
图1示出了用于尤其是为了操控建筑物中的房间操作元件RBE而提供基于语音的服务的第一示例性系统。根据图1的系统包括匿名化服务AD1,该匿名化服务AD1设立为,接收发送方(用户)P1、P2的语音指令SB1、SB2,并对所述语音指令SB1、SB2进行转换,使得语音指令SB1、SB2的发送方(用户)P1、P2的身份匿名化,其中匿名化服务AD1进一步设立为,针对音频设备AG1提供经过匿名化的语音指令ASB、ASB1、ASB2,和/或向音频设备AG1(例如Amazon Echo)发送所述经过匿名化的语音指令ASB、ASB1、ASB2。此外,根据图1的系统包括音频设备AG1(例如Amazon Echo/Alexa;数字援助服务),用于接收经过匿名化的语音指令ASB1、ASB2,其中音频设备AG1设立为,对接收到的语音指令ASB1、ASB2进行分析(NLP,自然语言处理(natural language processing)),将接收到的语音指令ASB1、ASB2转换成相对应的针对房间操作元件RBE的操作命令BK1-BK4,以操控建筑物中的HVAC设备(例如现场设备、执行器)G1-G4,并且转交给相对应的房间操作元件RBE或者直接转交给HVAC设备G1-G4(例如用于在建筑物中进行舒适控制的执行器)。
HVAC设备G1-G4例如可以是:采暖系统、通风系统、空调系统、照明系统、调光器、百叶窗的驱动器。房间操作元件RBE例如是用于操作、调节或者控制房间中的舒适变量(例如温度、光线、炫目)的房间设备或控制设备。
例如通过语音失真或者通过将语音指令SB1、SB2转换成所构建的虚构的语音(如例如在导航设备处的语音输出),由匿名化服务AD1将用户P1、P2的语音指令SB1、SB2匿名化。匿名化服务AD1为此相对应地来设立,也就是配备有相对应的硬件和软件。
不值得信赖的音频设备AG1包括合适的用于接收经过匿名化的语音指令ASB1、ASB2的接口。可选地,音频设备AG1包括用于分析语音指令ASB1、ASB2和用于生成相对应的操作命令BK1-BK4的机制,以利用相应的操作命令BK1-BK4操控建筑物中的设备或者程序(例如HVAC设备或者现场设备)。可以由音频设备AG1直接向相应的HVAC设备传输操作命令BK1-BK4,例如通过合适的无线电连接(例如WLAN,蓝牙(Bluetooth))来传输操作命令BK1-BK4。但是,也可以由音频设备AG1向相对应的房间操作元件RBE传输操作命令BK1-BK4。相对应的房间操作元件RBE将操作命令BK1-BK4转交给相应的HVAC设备,例如也通过合适的无线电连接(例如WLAN、蓝牙)转交给相应的HVAC设备。音频设备AG1为此配备有合适的硬件(例如处理器MC1和存储器M1),用于实施相对应的处理逻辑和相对应的软件(例如KI程序、神经网络、深度学习算法(Deep Learning Algorithmen))。存储器M1例如可以是如下语音缓存:该语音缓存包括经过标准化的或经常使用的语音指令,所述语音指令接着被用于进行匿名化。
可选地,由音频设备AG1可以将经过匿名化的语音指令ASB转交给服务器S。服务器S包括合适的硬件和软件,用于分析语音指令ASB并且用于生成相对应的操作命令BK3、BK4,以利用相应的操作命令BK3、BK4来操控相对应的HVAC设备G3、G4。
有利地,音频设备AG1和服务器S包括“人工智能”引擎(例如KI软件、如神经网络)。
有利地,匿名化服务AD1实现为建筑物通信网络(例如安装总线,KNX)中的网络部件(代理),并且音频设备AG1是建筑物通信网络的其他网络部件。建筑物自动化系统因此可以非常容易地被装有或者被补充装有匿名化服务。有利地,匿名化服务AD1和音频设备AG1作为网络部件(网络节点;例如作为BacNet对象)被集成到建筑物通信网络的基础设施中。有利地通过无线电连接。
图2示出了用于尤其是为了操控建筑物中的房间操作元件RBE而提供基于语音的服务的第二示例性系统。根据图2的系统包括匿名化服务AD2,该匿名化服务AD2设立为,接收发送方(用户)P3、P4的语音指令SB3、SB4,并对所述语音指令SB3、SB4进行转换,使得语音指令SB3、SB4的相应的发送方(用户)P3、P4的身份匿名化,其中匿名化服务AD2进一步设立为,针对音频设备AG2(例如Amazon Echo)提供经过匿名化的语音指令ASB‘、ASB3、ASB4。在根据图2的示例性系统中,匿名化服务AD2集成在值得信赖的音频设备AG2中,例如作为音频设备AG2(例如Amazon Echo/Alexa;数字援助服务)的硬件部件和/或软件部件而集成在值得信赖的音频设备AG2中。音频设备AG2设立为,对经过匿名化的语音指令ASB3、ASB4进行分析(NLP,自然语言处理),将经过匿名化的语音指令ASB3、ASB4转换成相对应的操作命令BK5-BK8,以操控建筑物中的设备(例如HVAC设备、现场设备、执行器)G1-G4,并且将操作命令BK5-BK8转交给相对应的房间操作元件RBE或者直接转交给HVAC设备G1-G4(例如用于在建筑物中进行舒适控制的执行器)或者另外的接收方。
可选地,由值得信赖的音频设备AG2可以将经过匿名化的语音指令ASB‘转交给值得信赖的服务器S。服务器S包括合适的硬件和软件,用于分析语音指令ASB‘并且用于生成相对应的操作命令BK7、BK8,以利用相应的操作命令BK7、BK8来操控相对应的HVAC设备G3、G4。有利地,音频设备AG2和服务器S包括“人工智能”引擎(例如KI软件、如神经网络)。
音频设备AG2配备有合适的硬件(例如处理器MC2和存储器M2),用于实施相对应的处理逻辑和相对应的软件(例如KI程序、神经网络、深度学习算法)。存储器M2例如可以是如下语音缓存:该语音缓存包括经过标准化的或经常使用的语音指令,所述语音指令接着被用于进行匿名化。
匿名化服务AD2在音频设备AG2中的集成使得能够将音频设备AG2与作为建造单元的匿名化服务AD2一起来推售和使用。这尤其使在建筑物中的安装变得简单,但是前提是,AG2在匿名化层AD2的运行与语音分析服务的运行分开的意义下是值得信赖的设备。
图3示出了用于尤其是为了操控建筑物中的房间操作元件RBE而提供基于语音的服务的第三示例性系统。根据图3的系统包括匿名化服务AD3,该匿名化服务AD3设立为,接收发送方(用户)P5的语音指令SB5,并对所述语音指令SB5进行转换,使得语音指令SB5的相应发送方(用户)P5的身份匿名化,其中匿名化服务AD3进一步设立为,针对音频设备AG3(例如Amazon Echo)提供经过匿名化的语音指令ASB5。在根据图3的示例性系统中,匿名化服务AD3在用户(发送方)P5的相对应配备的移动通信终端设备MG(例如智能电话、平板电脑)上实现。例如,作为如下App:该App通过相对应的从互联网的下载而已装载和安装到移动通信终端设备MG上。
用户P5说出语音指令SB5(例如“将温度提高3度”),该语音指令SB5由通信终端设备MG的麦克风来检测,通过匿名化服务AD3被转换成经过匿名化的语音指令ASB5,例如通过语音失真来转换成经过匿名化的语音指令ASB5。不值得信赖的音频设备AG3设立为,对经过匿名化的语音指令ASB5进行分析(NLP,自然语言处理),将经过匿名化的语音指令ASB5转换成相对应的针对房间操作元件RBE的操作命令BK9-BK12(例如指令的数字表示),以操控建筑物中的HVAC设备(例如现场设备,执行器)G1-G4,并且将操作命令BK9-BK12转交给相对应的房间操作元件RBE或者直接转交给HVAC设备G1-G4(例如用于在建筑物中进行舒适控制的执行器)。
音频设备AG3配备有合适的硬件(例如处理器MC3和存储器M3),用于实施相对应的处理逻辑和相对应的软件(例如KI程序、神经网络、深度学习算法)。存储器M3例如可以是如下语音缓存:该语音缓存包括经过标准化的或经常使用的语音指令,所述语音指令接着被用于进行匿名化。
可选地,由音频设备AG3可以将经过匿名化的语音指令ASB“转交给服务器S。服务器S包括合适的硬件和软件,用于分析语音指令ASB“并且用于生成相对应的操作命令BK11、BK12,以利用相应的操作命令BK11、BK12来操控相对应的HVAC设备G3、G4。
图4示出了示例性的匿名化服务AD4。匿名化服务或匿名化层AD4可以通过相对应的硬件、软件或固件来实现。有利地,匿名化服务或匿名化层AD4充当连接在音频设备AG4(例如Amazon Echo)的上游的代理,所述代理针对音频设备AG4以经过匿名化的形式提供和/或转交接收到的语音指令SB6-SB7。匿名化服务AD4包括具有相对应的处理逻辑(软件程序)的相对应设立的处理器(例如微处理器),以便提供他的服务。
有利地,匿名化服务连接在语音分析层的上游,并且有利地与语音分析层分开地运行。
用户P6发出语音指令SB6、SB7,所述语音指令SB6、SB7由匿名化服务AD4的麦克风Mikro(例如商业上通用的麦克风)来检测,并且由匿名化服务AD4的匿名化单元ANE匿名化,以致不可能返回引用(Rueckbezug)用户P6。匿名化单元ANE例如可以实现为语音失真器。但是,匿名化单元ANE也可以将用户P6的语音指令SB6、SB7转换成所构建的虚构的语音,例如通过随机地替代如下字来转换:所述字有利地在匿名化单元ANE的语音缓存SC中予以提供。语音缓存SC可以保持在匿名化单元ANE中或者在存储器SC中。
作为经过匿名化的语音指令ASB6、ASB7,要由匿名化单元ANE匿名化的语音指令SB6、SB7由匿名化服务AD4经由相对应设立的发送接口SSS被提供给音频设备AG4(例如Amazon Echo)和相对应的援助服务(例如Amazon Alexa),和/或例如通过合适的通信连接来转交。有利地,经由无线通信连接(例如NFC、蓝牙、WLAN)。
音频设备AG4(例如Amazon Echo)或相对应的援助服务(例如Amazon Alexa)包括分析引擎AE,以便对经过匿名化的语音指令ASB6、ASB7(例如通过NLP,自然语言处理)进行分析并且生成相对应的操作命令BK,以操控建筑物中的设备或者程序(例如HVAC设备或者现场设备)。分析引擎AE因此执行对经过匿名化的语音指令ASB6、ASB7的句法和语义分析,并且包括发生器,用于生成相对应的操作命令BK,以操控和影响现场设备(例如例如以控制光线或者采暖系统)。
有利地,为用户P6给出对他的语音指令SB6、SB7的反馈FB,其中确保了,音频设备AG4(例如Amazon Echo)或相对应的援助服务(例如Amazon Alexa)不能推断出反馈接收方、也就是该用户。
反馈FB例如可以是语音消息,或者是在显示器上的显示或者文本消息,所述显示器安置在音频设备AG4处。反馈FB可以是纯信息(例如“当前室温20度”),或者是针对用户P6的通过评估他早前的语音指令SB6、SB7进行的推荐。评估在反馈单元FBE1、FBE2中通过人工智能的方法(例如深度学习、神经网络)进行。有利地,反馈单元FBE1、FBE2也使用历史数据,所述历史数据例如存放在存储器M4中。反馈单元FBE1、FBE2可以位于匿名化服务AD4中和/或音频设备AG4中。如果反馈FB通过音频设备AG4来提供,则与音频设备AG4无关地并且与援助服务无关地,匿名化服务AD4负责将反馈FB专门关联至相应的用户P6。这例如可以通过评估来自语音指令的元信息(例如关于句子结构、字选择、频谱的特征)进行。
有利地,通过匿名化服务AD4进行语音指令SB6、SB7的单一化(Singularisierung)。也就是,一大批(多个)用户的语音指令SB6、SB7与用户组关联。例如,相应用户P的语音指令SB6、SB7以确定的用户组(例如确定的部门)的名义来执行,而无论多少个个人用户处于此后。始终关于该组进行反向关联,而不是关于已经放出语音指令的那个个人用户进行。以此,可能在企业内使用这样的援助服务(例如Amazon Alexa),尽管这出于数据保护原因实际上可能会被禁止也如此。
图5示出了针对用于提供基于语音的服务的方法的示例性流程图,其包括匿名化服务。该方法尤其是适合于操控建筑物中的房间操作元件。
该方法包括:
(VS1)通过音频设备接收语音指令,其中音频设备设立为,对接收到的语音指令进行分析(NLP,自然语言处理),将接收到的语音指令转换成相对应的操作命令,以操控建筑物中的设备(例如HVAC设备或者现场设备)和/或程序(例如建筑物管理站的程序),并且转交给相对应的房间操作元件或者直接转交给相应的建筑物基础设施技术;
其中在通过相对应的语音识别服务(援助服务,例如Amazon Alexa)评估语音指令之前,通过单独的和值得信赖的匿名化服务将语音指令的发送方(用户)的身份匿名化。
匿名化服务例如可以在音频设备中实现,或者在置于相对应的虚拟助理(例如Amazon Alexa)的上游的代理上实现。
通过由音频设备(例如Amazon Echo)来激活援助服务(例如Amazon Alexa),该援助服务生成针对HVAC设备或现场设备的相对应的命令,以便引起在房间或者建筑物中的舒适控制(例如温度控制、光线控制)。
有利地,匿名化通过经过随机化的语音异化进行,例如基于从语音缓存中提供的字、句或者句子部分来进行。
有利地,进行匿名化,使得在发送方与匿名化服务之间存在可追溯性,但是在发送方与音频设备之间不存在可追溯性。
有利地,基于对接收到的语音指令的分析,在音频设备中生成如下反馈:所述反馈由匿名化服务与专用发送方关联。
有利地,该方法通过相对应的计算机辅助的系统(例如微型计算机)来实现,所述计算机辅助的系统在音频设备中实施。
但是,匿名化服务也可以在用户的移动通信终端设备(例如智能电话、平板电脑)上实现。
本发明的针对系统和方法的、并且尤其是也针对计算机程序产品或计算机可读的存储介质的有创造性的特征和优点尤其是:
通过使用匿名化层,雇员可以在可供使用的硬件(通信终端设备或者另外的用于使用数字助理的专用硬件)上以保证数据保护的方式使用服务供应商/第三方供应商的援助服务(例如Amazon Echo,Alexa),以在工作环境中使用。在并非由雇主提供的硬件(例如智能电话)上,也可以使用提供匿名化层的软件/app。
这种匿名化层(软件)要么可以在通信终端设备上、在连接在中间的设备上,要么可以在雇主或者所委托的服务供应商的服务器场景(Serverlandschaft)之内。
匿名化允许在遵守数据保护的情况下使用援助服务、如例如Amazon Alexa。
为了能够对个别询问进行应答,询问身份或询问方身份朝援助服务方向被匿名化。在援助服务的应答中,应答又与实际用户关联,以致有针对性的应答/反应是可能的。
匿名化服务因此作为针对实际询问方(用户)的“代理”询问,并且以此遮掩其身份。以此,虽然首先仅信赖关系被置换(最终应用方现在必须信赖代理,而不是信赖服务供应商),但是这是决定性的区别:
在商业建筑物环境中,即能够被利用来进行匿名化的特点发挥作用:
- 这种“代理”可以直接在最终客户本身的控制下;或者在最终客户信赖的伙伴的控制下。
- 此外,一位置的所有设备既本地联网,又越来越多地与区域的、国家的或者甚至全球的数据中心连接。这又要么是最终客户自己的数据中心,要么是最终客户的信赖的伙伴的数据中心。由于代理作为相对于服务供应商的一个实体出现,所以询问方的“池(Pool)”越大,则相对于服务供应商的匿名性就变得越好。
- 对于在建筑物环境中的大多数应用情况而言,不重要的是哪个人给出语音指令。具体的人因而已经可以在本地通过抽象的人来替代。例如,这可以被完成:
• 故意带有损失并且以此不再是可逆的(例如,在服务供应商被调用之前,通过直接在设备中的或者在任意另外的部位处的经过随机化的语音异化);
• 故意异化,但是本地可逆(如前文那样,但是经过随机化的实体在本地保持至询问方的连接):这允许个人简档(Profile),但是甚至只有代理知道该个人简档,而服务供应商不知道该个人简档;
• 在前文所提到的这两个情况中,实际上进行询问的人可以保持匿名,因为他/她虽然可以向语音控制的设备表明身份(=他/她愿意这样),但是并不必须:如所提及的那样,该动作最后在概念上针对建筑物的实体(例如房间)实施,而不是针对用户实施。
- 这种代理方案的匿名化程度可以通过其他措施来提高:
• 混合(Mixe):代理随机化地查询一个以上的服务供应商。或者,所述查询与另外的信赖的伙伴的代理混合。在这两种情况下,提高了熵,这从这个/这些服务供应商方面使可追溯性变得困难;
• 缓存(Cacheing):既越过时间地,又越过联网的建筑物集合地,给出相同的控制指令的概率极大提高。
• 语音缓存(参见图4)可以以高概率学会语音指令的大部分,并且可以直接从缓存中操作这些语音指令的大部分,而不是必须询问服务供应商。这不仅提高了匿名性,而且自然提高了系统的性能。另外,以此也会允许优化成本,因为语音服务供应商典型地按照进行的询问的数目对其服务结算;
• 语音缓存(参见图4)可以彼此(匿名地)被调准:因为语音指令非常频繁地与建筑物结构相关,所以识别率能够得到极大改进。一方面,因为代理知道在何处曾放出该指令(例如仅在窗户前也有百叶窗的房间中放出百叶窗控制指令;相反,系统自然允许在每个在窗户前有百叶窗的房间中也都期望有针对他们的语音指令)。另一方面,因为在建筑物的类似实体中(例如“在窗户前有百叶窗的房间”),在世界范围内也要期望有类似的语音指令。
- 匿名化进行询问的服务使用者(特别从服务供应商的视角来看)。
- 形成逻辑使用者集群(Cluster)的可能性:这样例如一建筑物的所有辅助询问可能会在该“屋顶”下汇总,用于进行评估;这又能够实现关于优化潜力的评估(这特别是时常被询问->是否可能在默认情况下供应该功能,以便减少询问;使用者的“难处是什么”->这里是否可能可进行补救/>);关于各个建筑物的评估(这样因为用户集群包括在建筑物之内的所有用户)并且以此在逻辑集群之间的比较可能性。
- 通过逻辑询问捆绑(Anfragebuendelung),服务供应商的智能(例如相对应的KI程序、神经网络)还始终学习习惯等等,也就是变得更好,并且适应于使用者,而无需了解单个询问方;逻辑集群(结构)作为服务使用者出现—相对应地AI引擎(KI机器)学习该结构的偏爱等等,例如特定的建筑物(对应于出自该集群中的询问的总和)。
- (在使用者侧)在一个表面下使用任意的/任意多的援助服务的可能性;由此视问题提出/任务安排而定地,使用最好的/最有意义的服务,而不要实际使用者操心;由此,此外在用户侧(也就是在使用者侧)的自己的品牌/UI是可能的。
- 进行询问的“预先解析”的可能性:在此,例如在雇主的IT之内,在转交给虚拟援助服务的实际服务供应商之前,使用者放出的对语音服务的询问在语义上被检查。视询问的内容/上下文而定,选择相对应“最好的”(这也可以是货币的、合同等的原因,并且并不限于结果质量)AI服务(也就是最好的虚拟援助服务),并且向该相对应“最好的”AI服务路由所述询问。在这种情况下,又可以利用“群集匿名化”的可能性。
- 数据保护的其他可能性在于,在询问AI服务(援助服务)之前,可以执行语音调制;在此,语音询问例如在音高/调制/速度方面被改变(例如职员X的语音被转换成合成语音)。
- 其他可能性在于,已经在向服务供应商查询之前,执行语音识别(Speech toText(语音到文本)),并且经由接口(API)向服务供应商传送识别出的语音到文本内容。这意味着简单的匿名化以及传输效率。
- 所描述内容的使用在私人领域中也是可能的,并且不是仅限制到职业/商业领域。
– 可能的是,在遵守数据保护决定的条件和预防措施的情况下,将商业上的大型供应商的AI/语音助理(例如Amazon的Alexa、Google Assistant、Google Now)使用在企业的工作环境中。
用于尤其是为了操控建筑物中的房间操作元件而提供基于语音的服务的方法和系统,其中通过音频设备接收语音指令,其中音频设备设立为,对接收到的语音指令进行分析,将接收到的语音指令转换成相对应的针对房间操作元件的操作命令,以操控建筑物中的尤其是HVAC设备(例如现场设备),并且转交给相对应的房间操作元件;而且其中在音频设备处接收到语音指令之前,通过匿名化服务将语音指令的发送方(用户)的身份匿名化。
附图标记
P1-P6 用户
MG 移动设备
SB1-SB7 语音指令
ASB1-ASB7、ASB、ASB‘、ASB“ 经过匿名化的语音指令
BK1-BK12、BK 操作命令
RBE 房间操作元件
AD1-AD4 匿名化服务
AG1-AG4 音频设备
MC1-MC3 处理器
M1-M4 存储器
Mikro 麦克风
ANE 匿名化单元
AE 分析引擎
SSS 发送接口
FBE1、FBE2 反馈单元
SC 语音缓存
FB 反馈
S 服务器
G1-G4 设备
VS1 方法步骤
Claims (14)
1.一种用于为了操控建筑物基础设施技术而提供基于语音的服务的方法,所述方法包括:通过音频设备(AG1-AG4)接收语音指令(SB1-SB7,ASB1-ASB7,ASB,ASB‘,ASB“),其中所述音频设备(AG1-AG4)设立为,对接收到的语音指令(SB1-SB7,ASB1-ASB7,ASB,ASB‘,ASB“)进行分析,将所述接收到的语音指令(SB1-SB7,ASB1-ASB7,ASB,ASB‘,ASB“)转换成相对应的操作命令(BK1-BK12,BK),以操控建筑物中的设备(G1-G4)和/或程序,并且转交给相对应的房间操作元件(RBE)或者直接转交给相应的建筑物基础设施技术;
其中,在通过相对应的语音识别服务评估所述语音指令(SB1-SB7,ASB1-ASB7,ASB,ASB‘,ASB“)之前,通过单独的和值得信赖的匿名化服务(AD1-AD4)将所述语音指令(SB1-SB7)的发送方(P1-P6)的身份匿名化。
2.根据权利要求1所述的方法,其中,所述匿名化通过经过随机化的语音异化进行。
3.根据上述权利要求中任一项所述的方法,其中,进行所述匿名化,使得在所述发送方(P1-P6)与所述匿名化服务(AD1-AD4)之间存在可追溯性,但是在所述发送方(P1-P6)与所述音频设备之间不存在可追溯性。
4.根据权利要求1或者2所述的方法,其中,基于对所述接收到的语音指令的分析,所述音频设备生成反馈(FB),所述反馈(FB)由所述匿名化服务(AD1-AD4)与专用发送方(P1-P6)关联。
5.根据权利要求1或者2所述的方法,其中,所述相对应的操作命令(BK1-BK12,BK)用于操控HVAC设备或者现场设备。
6.根据权利要求1或者2所述的方法,其中,所述相对应的语音识别服务是援助服务。
7.一种用于为了操控建筑物中的房间操作元件(RBE)而提供基于语音的服务的系统,所述系统包括:
值得信赖的匿名化服务(AD1-AD4),所述匿名化服务(AD1-AD4)设立为,接收发送方(P1-P6)的语音指令(SB1-SB7),并且对所述语音指令(SB1-SB7)进行转换,使得所述语音指令的所述发送方(P1-P6)的身份匿名化,其中所述匿名化服务(AD1-AD4)进一步设立为,针对音频设备(AG1-AG4)提供经过匿名化的语音指令(ASB1-ASB7,ASB,ASB‘,ASB“);
音频设备(AG1-AG4),用于接收所述经过匿名化的语音指令(ASB1-ASB7,ASB,ASB‘,ASB“),其中所述音频设备(AG1-AG4)设立为,对接收到的语音指令(ASB1-ASB7,ASB,ASB‘,ASB“)进行分析,将所述接收到的语音指令(ASB1-ASB7,ASB,ASB‘,ASB“)转换成相对应的操作命令(BK1-BK12,BK),以操控建筑物中的设备(G1-G4)和/或程序,并且转交给所述设备(G1-G4)和/或程序。
8.根据权利要求7所述的系统,其中,所述匿名化服务(AD1-AD4)在所述发送方(P1-P6)的相对应配备的移动通信终端设备(MG)上实现。
9.根据权利要求7或者8所述的系统,其中,所述匿名化服务(AD1-AD4)集成在所述音频设备(AG1-AG4)中。
10.根据权利要求7或者8所述的系统,其中,所述匿名化服务(AD1-AD4)实现为建筑物通信网络中的值得信赖的网络部件,并且其中所述音频设备(AG1-AG4)是所述建筑物通信网络的其他值得信赖的网络部件。
11.根据权利要求10所述的系统,其中,所述匿名化服务(AD1-AD4)实现为代理。
12.根据权利要求7或者8所述的系统,其中,所述音频设备(AG1-AG4)是不值得信赖的音频设备。
13.根据权利要求7或者8所述的系统,其中,所述相对应的操作命令(BK1-BK12,BK)用于操控HVAC设备或者现场设备。
14.一种计算机可读的存储介质,其存储如下指令:当所述指令由计算机实施时,所述指令促使所述计算机执行一种用于为了操控建筑物中的设备或者为了操控建筑物中的程序而提供基于语音的服务的方法,其中所述方法包括:
提供匿名化服务(AD1-AD4),所述匿名化服务(AD1-AD4)对用户(P1-P6)的接收到的语音指令(SB1-SB7)进行转换,使得所述语音指令的所述用户(P1-P6)的身份被匿名化,其中所述匿名化服务(AD1-AD4)向援助服务输出经过匿名化的语音指令(ASB1-ASB7,ASB,ASB‘,ASB“);以及
提供所述援助服务,以接收所述经过匿名化的语音指令(ASB1-ASB7,ASB,ASB‘,ASB“),其中所述援助服务对接收到的经过匿名化的语音指令(ASB1-ASB7,ASB,ASB‘,ASB“)进行分析,将所述接收到的经过匿名化的语音指令(ASB1-ASB7,ASB,ASB‘,ASB“)转换成相对应的操作命令(BK1-BK12,BK),以操控建筑物中的设备和/或以操控建筑物中的程序,并且转交给所述设备和/或所述程序。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102018202018.3 | 2018-02-09 | ||
DE102018202018.3A DE102018202018B3 (de) | 2018-02-09 | 2018-02-09 | Verfahren und System zum Bereitstellen eines sprachbasierten Dienstes, insbesondere für die Ansteuerung von Raumbedienelementen in Gebäuden |
PCT/EP2019/050945 WO2019154598A1 (de) | 2018-02-09 | 2019-01-15 | Verfahren und system zum bereitstellen eines sprachbasierten dienstes, insbesondere für die ansteuerung von raumbedienelementen in gebäuden |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111670470A CN111670470A (zh) | 2020-09-15 |
CN111670470B true CN111670470B (zh) | 2023-12-05 |
Family
ID=65241209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980012359.1A Active CN111670470B (zh) | 2018-02-09 | 2019-01-15 | 尤其是为了操控建筑物中的房间操作元件而提供基于语音的服务的方法和系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210043332A1 (zh) |
EP (1) | EP3750155A1 (zh) |
CN (1) | CN111670470B (zh) |
DE (1) | DE102018202018B3 (zh) |
WO (1) | WO2019154598A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11929067B2 (en) * | 2018-05-25 | 2024-03-12 | Carrier Corporation | Controlling home automation devices through security panel using voice assistant |
EP3990989A1 (en) * | 2019-06-28 | 2022-05-04 | ABB Schweiz AG | Interactive field device interface for monitoring and controlling an industrial process by industrial automation system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101518074A (zh) * | 2006-04-13 | 2009-08-26 | 阿詹姆斯有限责任公司 | 用于控制终端设备的系统 |
KR20120026465A (ko) * | 2010-09-09 | 2012-03-19 | 시리트 엘엘씨 | 하나 이상의 비밀 엔티티로 주소 지정된 하나 이상의 코뮈니케에 관한 하나 이상의 청구서에 대한 하나 이상의 비밀 엔티티 조건부 난독화 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8473451B1 (en) * | 2004-07-30 | 2013-06-25 | At&T Intellectual Property I, L.P. | Preserving privacy in natural language databases |
US7502741B2 (en) * | 2005-02-23 | 2009-03-10 | Multimodal Technologies, Inc. | Audio signal de-identification |
US20070178884A1 (en) * | 2005-12-07 | 2007-08-02 | General Instrument Corporation | Remote Provisioning of Privacy Settings in a Home Multimedia Network |
JP5095281B2 (ja) * | 2007-07-11 | 2012-12-12 | 株式会社日立製作所 | 文字列匿名化装置、文字列匿名化方法及び文字列匿名化プログラム |
US20100039218A1 (en) * | 2008-08-14 | 2010-02-18 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | System and method for transmitting illusory and non-illusory identification characteristics |
US9659188B2 (en) * | 2008-08-14 | 2017-05-23 | Invention Science Fund I, Llc | Obfuscating identity of a source entity affiliated with a communiqué directed to a receiving user and in accordance with conditional directive provided by the receiving use |
US8200480B2 (en) * | 2009-09-30 | 2012-06-12 | International Business Machines Corporation | Deriving geographic distribution of physiological or psychological conditions of human speakers while preserving personal privacy |
US10395672B2 (en) * | 2012-05-31 | 2019-08-27 | Elwha Llc | Methods and systems for managing adaptation data |
US9305565B2 (en) * | 2012-05-31 | 2016-04-05 | Elwha Llc | Methods and systems for speech adaptation data |
US8554559B1 (en) | 2012-07-13 | 2013-10-08 | Google Inc. | Localized speech recognition with offload |
US9437207B2 (en) | 2013-03-12 | 2016-09-06 | Pullstring, Inc. | Feature extraction for anonymized speech recognition |
US20180005626A1 (en) * | 2015-02-26 | 2018-01-04 | Longsand Limited | Obfuscating training data |
US10282166B2 (en) * | 2017-05-03 | 2019-05-07 | The Reverie Group, Llc | Enhanced control, customization, and/or security of a sound controlled device such as a voice controlled assistance device |
US11005993B2 (en) * | 2017-07-14 | 2021-05-11 | Google Llc | Computational assistant extension device |
US11450314B2 (en) * | 2017-10-03 | 2022-09-20 | Google Llc | Voice user interface shortcuts for an assistant application |
US11069349B2 (en) * | 2017-11-08 | 2021-07-20 | Dillard-Apple, LLC | Privacy-preserving voice control of devices |
EP3496090A1 (en) * | 2017-12-07 | 2019-06-12 | Thomson Licensing | Device and method for privacy-preserving vocal interaction |
US11217223B2 (en) * | 2020-04-28 | 2022-01-04 | International Business Machines Corporation | Speaker identity and content de-identification |
-
2018
- 2018-02-09 DE DE102018202018.3A patent/DE102018202018B3/de active Active
-
2019
- 2019-01-15 EP EP19702191.8A patent/EP3750155A1/de active Pending
- 2019-01-15 CN CN201980012359.1A patent/CN111670470B/zh active Active
- 2019-01-15 WO PCT/EP2019/050945 patent/WO2019154598A1/de unknown
- 2019-01-15 US US16/968,541 patent/US20210043332A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101518074A (zh) * | 2006-04-13 | 2009-08-26 | 阿詹姆斯有限责任公司 | 用于控制终端设备的系统 |
KR20120026465A (ko) * | 2010-09-09 | 2012-03-19 | 시리트 엘엘씨 | 하나 이상의 비밀 엔티티로 주소 지정된 하나 이상의 코뮈니케에 관한 하나 이상의 청구서에 대한 하나 이상의 비밀 엔티티 조건부 난독화 |
Also Published As
Publication number | Publication date |
---|---|
WO2019154598A1 (de) | 2019-08-15 |
US20210043332A1 (en) | 2021-02-11 |
DE102018202018B3 (de) | 2019-05-09 |
CN111670470A (zh) | 2020-09-15 |
EP3750155A1 (de) | 2020-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Taddeo et al. | How AI can be a force for good | |
US11151994B2 (en) | Methods and systems for managing voice commands and the execution thereof | |
US9832228B2 (en) | Methods, systems, and computer program products for managing firewall change requests in a communication network | |
US7660799B2 (en) | Remote desktop system | |
US8141160B2 (en) | Mitigating and managing privacy risks using planning | |
CN111670470B (zh) | 尤其是为了操控建筑物中的房间操作元件而提供基于语音的服务的方法和系统 | |
US20200090659A1 (en) | Methods and systems for personalized rendering of presentation content | |
US20180063262A1 (en) | Facilitation of communications to another party using cognitive techniques | |
Kapitsaki | Reflecting user privacy preferences in context-aware web services | |
US20210133682A1 (en) | Automatic group creation based on organization hierarchy | |
Kobayashi et al. | Mobile security assurance for automotive software through ArchiMate | |
Tsigkanos et al. | Architectural considerations for privacy on the edge | |
US20170351855A1 (en) | Identifying sensitive information in a communication based on network communications history | |
US9609625B2 (en) | Multichannel preferred device notification | |
US10991361B2 (en) | Methods and systems for managing chatbots based on topic sensitivity | |
US20200145363A1 (en) | Automatic notification generation for electronic processing systems | |
US10938830B2 (en) | Authorizing and nullifying commands issued to virtual assistants in an internet of things (IoT) computing environment based on hierarchal user access levels | |
Zipperle et al. | Context-aware transfer of task-based IoT service settings | |
CN112395639A (zh) | 用于管理私人信息的个人顾问 | |
US20200005792A1 (en) | Novel and innovative means of providing an anonymized and secure mechanism for speech-to-text conversion. This invention provides a versatile and extensible privacy layer that leverages existing cloud-based Automated Speech Recognition (ASR) services and can accommodate emerging speech-to-text technologies, such as Natural Language Processing (NLP), voice bots and other voice-based artificial intelligence interfaces. This invention also allows the latest and best-of-breed speech technologies to be applied to the legal, medical, financial, and other privacy-sensitive fields without sacrificing | |
US8490202B2 (en) | Method for masking data | |
Hansen et al. | Identity Management Systems: Gateway and Guardian for Virtual Residences | |
Watson | Information Theory Applied to Decision-Making Structures | |
Nower | Supporting Audio Privacy-aware Services in Emerging IoT Environment | |
Schaefer et al. | Profile processing and evolution for smart environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |