KR102417524B1 - 음성 인식 기반의 자동차 제어 방법 - Google Patents
음성 인식 기반의 자동차 제어 방법 Download PDFInfo
- Publication number
- KR102417524B1 KR102417524B1 KR1020170133259A KR20170133259A KR102417524B1 KR 102417524 B1 KR102417524 B1 KR 102417524B1 KR 1020170133259 A KR1020170133259 A KR 1020170133259A KR 20170133259 A KR20170133259 A KR 20170133259A KR 102417524 B1 KR102417524 B1 KR 102417524B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- voice command
- server
- voice recognition
- portable device
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000003287 optical effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/014—Hand-worn input/output arrangements, e.g. data gloves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/0346—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of the device orientation or free movement in a 3D space, e.g. 3D mice, 6-DOF [six degrees of freedom] pointers using gyroscopes, accelerometers or tilt-sensors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/033—Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
- G06F3/038—Control and interface arrangements therefor, e.g. drivers or device-embedded control circuitry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0853—Network architectures or network communication protocols for network security for authentication of entities using an additional device, e.g. smartcard, SIM or a different communication terminal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
- H04W4/44—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for communication between vehicles and infrastructures, e.g. vehicle-to-cloud [V2C] or vehicle-to-home [V2H]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/70—Services for machine-to-machine communication [M2M] or machine type communication [MTC]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2203/00—Indexing scheme relating to G06F3/00 - G06F3/048
- G06F2203/038—Indexing scheme relating to G06F3/038
- G06F2203/0381—Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0876—Network architectures or network communication protocols for network security for authentication of entities based on the identity of the terminal or configuration, e.g. MAC address, hardware or software configuration or device fingerprint
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Mechanical Engineering (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Abstract
본 발명은 음성 인식 기반의 자동차 제어 방법에 관한 것으로, 인증을 위한 정보(예를 들면 패스워드 또는 핀 코드)를 직접 음성 형태로 발화하지 않고 사용자의 휴대용 기기(예를 들면 웨어러블 기기)를 통해 비공개적으로 사용자 인증이 이루어지도록 함으로써 사용자 인증 시 충분한 보안이 이루어지도록 하는데 그 목적이 있다. 이를 위해 본 발명에 따른 음성 인식 기반의 자동차 제어 방법은, 음성 명령의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 상기 음성 명령을 제 1 서버로 전송하는 단계와; 상기 음성 명령의 발생에 응답하여 휴대용 디바이스를 경유하는 제 2 경로를 통해 상기 휴대용 디바이스의 인증 데이터 및 상기 음성 명령을 상기 제 1 서버로 전송하는 단계와; 상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 디바이스의 인증을 수행하고, 상기 휴대용 디바이스의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함한다.
Description
본 발명은 자동차에 관한 것으로, 음성 인식 기반의 자동차 제어에 관한 것이다.
음성 인식 기술이 발달함에 따라 사용자가 발화에 의해 발생하는 음성 명령을 인식하여 해당 명령을 수행하는 음성 인식 비서 서비스의 활용이 크게 증가하고 있다. 음성 인식 비서 서비스는 적용 범위가 가정에서 자동차 등의 다양한 분야로 확대되고 있다. 즉, 음성 인식 비서 서비스와 텔레매틱스 서비스가 연계되어 사용자의 발화에 의해 생성되는 음성 명령이 자동차에 전달되어 자동차의 제어가 이루어진다. 이를 통해 사용자는 자동차의 도어를 잠금/해제하거나, 공조기를 미리 턴 온 시켜서 자동차 내부의 온도를 조절할 수 있다.
이와 같이 음성 인식 비서 서비스를 사용하기 위해서는 사용자 인증이 필요하다. 사용자 인증을 거치지 않으면 허용되지 않은 사람이 자동차를 무단으로 사용할 가능성이 있기 때문이다. 기존의 사용자 인증 방법은 패스워드(예를 들면 PIN Code)를 발화하여 홈 스피커(120)가 인식하도록 하는 것을 예로 들 수 있다. 그러나 이와 같은 패스워드의 직접 발화를 통한 사용자 인증은 패스워드가 노출될 우려가 있어서 꺼려지게 마련이다.
본 발명의 일 측면에 따르면, 인증을 위한 정보(예를 들면 패스워드 또는 핀 코드)를 직접 음성 형태로 발화하지 않고 사용자의 휴대용 기기(예를 들면 웨어러블 기기)를 통해 비공개적으로 사용자 인증이 이루어지도록 함으로써 사용자 인증 시 충분한 보안이 이루어지도록 하는데 그 목적이 있다.
상술한 목적의 본 발명에 따른 음성 인식 기반의 자동차 제어 방법은, 음성 명령의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 상기 음성 명령을 제 1 서버로 전송하는 단계와; 상기 음성 명령의 발생에 응답하여 휴대용 디바이스를 경유하는 제 2 경로를 통해 상기 휴대용 디바이스의 인증 데이터 및 상기 음성 명령을 상기 제 1 서버로 전송하는 단계와; 상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 디바이스의 인증을 수행하고, 상기 휴대용 디바이스의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함한다.
상술한 음성 인식 기반의 자동차 제어 방법은, 상기 음성 명령의 유효성 판단을 위해, 상기 제 1 경로를 통해 전송되는 음성 명령과 상기 제 2 경로를 통해 전송되는 음성 명령을 비교하여 일치 여부를 판단하는 것을 더 포함한다.
상술한 음성 인식 기반의 자동차 제어 방법은, 상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함한다.
상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 제 2 서버는 텔레매틱스 서버이고; 상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것이다.
상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기이다.
상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기이다.
상술한 목적의 본 발명에 따른 또 다른 음성 인식 기반의 자동차 제어 방법은, 휴대용 디바이스에서 제스처 이벤트가 발생하는 단계와; 상기 제스처 이벤트의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 음성 명령을 제 1 서버로 전송하는 단계와; 상기 제스처 이벤트의 발생에 응답하여 상기 휴대용 디바이스를 경유하는 제 2 경로를 통해 상기 휴대용 디바이스의 인증 데이터 및 제스처 이벤트 데이터를 상기 제 1 서버로 전송하는 단계와; 상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 디바이스의 인증을 수행하고, 상기 휴대용 디바이스의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함한다.
상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 제스처 이벤트의 발생 후 미리 설정된 시간 내에 입력되는 음성 신호만을 음성 명령으로 인식한다.
상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 휴대용 디바이스의 사용자가 신체의 일부를 움직이는 것을 움직임 센서를 통해 감지함으로써 상기 제스처 이벤트가 생성된다.
상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 움직임 센서는, 상기 사용자의 신체의 일부가 움직이는 것을 감지하도록 마련되는 자이로 센서와 비전 센서, 광 센서 가운데 적어도 하나이다.
상술한 음성 인식 기반의 자동차 제어 방법은, 상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함한다.
상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 제 2 서버는 텔레매틱스 서버이고; 상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것이다.
상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기이다.
상술한 음성 인식 기반의 자동차 제어 방법에서, 상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기이다.
상술한 목적의 본 발명에 따른 음성 인식 제어 방법은, 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 음성 명령을 제 1 서버로 전송하는 단계와; 휴대용 디바이스를 경유하는 제 2 경로를 통해 상기 휴대용 디바이스의 인증 데이터를 상기 제 1 서버로 전송하는 단계와; 상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 디바이스의 인증을 수행하고, 상기 휴대용 디바이스의 인증 결과에 따라 상기 음성 명령의 유효성을 판단하는 단계를 포함한다.
상술한 음성 인식 제어 방법은, 상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함한다.
상술한 음성 인식 제어 방법에서, 상기 제 2 서버는 텔레매틱스 서버이고; 상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것이다.
상술한 음성 인식 제어 방법에서, 상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기이다.
상술한 음성 인식 제어 방법에서, 상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기이다.
본 발명의 일 측면에 따르면, 인증을 위한 정보(예를 들면 패스워드 또는 핀 코드)를 직접 음성 형태로 발화하지 않고 사용자의 휴대용 기기(예를 들면 웨어러블 기기)를 통해 비공개적으로 사용자 인증이 이루어지도록 함으로써 사용자 인증 시 충분한 보안이 이루어지도록 한다.
도 1은 본 발명의 일 실시 예에 따른 음성 인식 기반의 자동차 제어 시스템을 나타낸 도면이다.
도 2는 도 1에 나타낸 자동차 제어 시스템의 구체적인 구성을 나타낸 도면이다.
도 3은 본 발명의 일 실시 예에 따른 음성 인식 기반의 자동차 제어 방법을 나타낸 도면이다.
도 4는 도 3에 나타낸 자동차 제어 방법의 제 1 실시 예를 나타낸 도면이다.
도 5는 도 3에 나타낸 자동차 제어 방법의 제 2 실시 예를 나타낸 도면이다.
도 2는 도 1에 나타낸 자동차 제어 시스템의 구체적인 구성을 나타낸 도면이다.
도 3은 본 발명의 일 실시 예에 따른 음성 인식 기반의 자동차 제어 방법을 나타낸 도면이다.
도 4는 도 3에 나타낸 자동차 제어 방법의 제 1 실시 예를 나타낸 도면이다.
도 5는 도 3에 나타낸 자동차 제어 방법의 제 2 실시 예를 나타낸 도면이다.
도 1은 본 발명의 일 실시 예에 따른 음성 인식 기반의 자동차 제어 시스템을 나타낸 도면이다.
주거 공간(140)에는 홈 스피커(130)를 기반으로 하는 음성 인식 비서 서비스가 마련된다. 음성 인식 비서 서비스는 사용자(110)가 발화를 통해 음성 명령을 발생시키면 홈 스피커(130)에 마련되어 있는 음성 인식 기능 및 인공 지능이 사용자(110)의 음성 명령을 인식하여 해당 명령을 수행하는 서비스이다.
예를 들면 주거 공간(140) 내에 설치되어 있는 에어컨을 켜고 목표 온도를 설정하고자 할 때, 사용자(110)는 “에어컨 켜고, 설정 온도는 25℃로 맞춰 줘.”라고 발화하면 홈 스피커(120)가 사용자(110)의 음성 명령을 인식하고 해당 명령대로 에어컨을 켜고 온도를 25℃로 설정한다. 이와 같은 음성 인식 비서 서비스는 주거 공간(140) 내의 가전 기기들과 홈 스피커(130)가 통신 가능하도록 홈 네트워크를 통해 연결되는 것을 전제로 한다.
음성 인식 비서 서비스는 적용 범위가 가정에서 자동차(100)로 확대되고 있다. 즉, 음성 인식 비서 서비스와 텔레매틱스 서비스가 연계되어 사용자(110)의 발화에 의해 생성되는 음성 명령이 자동차(100)에 전달되어 자동차(100)의 제어가 이루어진다.
예를 들면, 자동차(100)의 시트의 온도를 미리 높이고자 할 때, 사용자(110)는 “자동차의 열선 시트를 켜 줘.”라고 발화하면 홈 스피커(120)가 사용자(110)의 음성 명령을 IoT 서버(150)를 통해 텔레매틱스 서버(160)에 전달하여 자동차(100)의 제어가 이루어지도록 한다.
이와 같이 사용자(110)가 음성 인식 명령을 발생시키기 위해서는 사용자 인증이 필요하다. 사용자 인증을 거치지 않으면 허용되지 않은 사람이 자동차(100)를 무단으로 사용할 가능성이 있기 때문이다. 기존의 사용자 인증 방법은 패스워드(예를 들면 PIN Code)를 발화하여 홈 스피커(120)가 인식하도록 하는 것을 예로 들 수 있다. 그러나 이와 같은 패스워드의 직접 발화를 통한 사용자 인증은 패스워드가 노출될 우려가 있어서 꺼려지게 마련이다.
본 발명의 실시 예에 따른 음성 인식 비서 서비스를 이용한 자동차의 제어에서는 패스워드를 직접 발화하지 않고 사용자(110)가 착용(휴대)한 기기(예를 들면 웨어러블 기기(120))를 통해 비공개적으로 사용자 인증이 이루어진다. 이를 위해 사용자(110)는 웨어러블 기기(120)를 IoT 서버(150)에 미리 등록해 두고, 실 사용 시 웨어러블 기기(120)의 인증으로 사용자 인증을 대신할 수 있도록 한다.
도 2는 도 1에 나타낸 자동차 제어 시스템의 구체적인 구성을 나타낸 도면이다.
웨어러블 기기(120)는 음성 신호 처리부(122)와 움직임 센서(124)를 포함한다. 웨어러블 기기(120)의 음성 신호 처리부(122)는 마이크로폰(미도시)을 통해 입력되는 음성 신호를 전기 신호로 변환하고 다시 디지털 데이터 형태로 변환한다. 움직임 센서(124)는 사용자(110)의 제스처를 감지하도록 마련된다. 움직임 센서(124)는 자이로 센서나 비전 센서, 광 센서처럼 사용자(110)의 신체의 일부가 움직이는 것(제스처)을 감지하기 위한 것이다. 웨어러블 기기(120)를 이용한 미리 약속된 형태의 제스처 이벤트는 사용자(110)가 발화를 통한 음성 명령을 발생시킴을 예고하는 사전 준비 동작일 수 있다.
홈 스피커(130)는 음성 인식 비서 서비스의 기반이 되는 장치이다. 사용자(110)가 음성 인식 비서 서비스를 이용하기 위해 발화를 통해 음성 명령을 발생시키면 홈 스피커(130)에 마련되어 있는 음성 인식 기능 및 인공 지능이 사용자(110)의 음성 명령을 인식하여 해당 명령을 수행한다. 이를 위해 홈 스피커(130)는 음성 신호 처리부(132)와 TTS 처리부(134)를 포함한다. 홈 스피커(130)의 음성 신호 처리부(132)는 마이크로폰(미도시)을 통해 입력되는 음성 신호를 전기 신호로 변환하고 다시 디지털 데이터 형태로 변환한다. TTS 처리부(134)는 텍스트 데이터를 음성 신호로 변환하여(Text-to-Speech) 출력하도록 마련된다. 예를 들면 사용자(110)에게 음성 형태의 메시지를 출력하고자 할 때 해당 내용의 텍스트를 인간의 언어로 변환하여 출력한다.
IoT 서버(150)는 웨어러블 기기(122)와 홈 스피커(130), 텔레매틱스 서버(160)와 통신 가능하도록 연결된다. IoT 서버(150)는 음성 명령의 변환과 사용자의 인증 등을 수행한다. 웨어러블 기기 인증 데이터베이스(152)와 음성 저장부(154), 웨어러블 기기 인증 처리부(156), 명령어 처리부(158)를 포함한다. 웨어러블 기기 인증 데이터베이스(152)는 웨어러블 기기(120)의 인증을 위해 필요한 정보가 저장된다. 예를 들면 사용자(110)가 웨어러블 기기(120)를 사전이 미리 등록하기 위해 입력하는 웨어러블 기기(120)의 고유 정보가 웨어러블 기기 인증 데이터베이스(152)에 저장된다. 웨어러블 기기 인증 데이터베이스(152)에 저장되어 있는 정보는 향후 웨어러블 기기(120)의 인증을 위해 사용된다. 음성 저장부(154)는 웨어러블 기기(120) 또는 홈 스피커(130)를 통해 전달되는 음성 명령이 저장된다. 웨어러블 기기 인증 처리부(156)는 웨어러블 기기 인증 데이터베이스(152)에 저장되어 있는 정보에 기초하여 웨어러블 기기(120)가 사전에 미리 등록된 것임을 확인하는 인증을 수행한다. 명령어 처리부(158)는 사용자(110)가 발화를 통해 생성한 음성 명령을 스피치-텍스트 변환을 통해 텍스트 형태로 변환한다.
도 3은 본 발명의 일 실시 예에 따른 음성 인식 기반의 자동차 제어 방법을 나타낸 도면이다.
도 3에 나타낸 바와 같이, 사용자(110)로부터 음성 명령이 발생하면(312), 음성 인식 서비스 장치인 홈 스피커(130)를 통해 제 1 서버인 IoT 서버(150)로 전송되고(332), 또 휴대용 기기인 웨어러블 기기(120)를 통해 제 1 서버인 IoT 서버(150)로 전송된다(322). 이와 같은 두 개의 경로를 통해 전송되는 음성 명령은 IoT 서버(150)에 수신된다(352). IoT 서버(150)에서는 음성 명령의 유효성 판단을 위해 웨어러블 기기(120)의 인증이 이루어진다(354). 웨어러블 기기(120)의 인증이 정상적으로 이루어져서 음성 명령의 유효성이 확보되면, 음성 명령이 IoT 서버(150)에서 제 2 서버인 텔레매틱스 서버(160)로 전송되어 자동차(362)의 제어가 이루어진다(356)(362).
도 4는 도 3에 나타낸 자동차 제어 방법의 제 1 실시 예를 나타낸 도면이다. 도 4에 나타낸 제 1 실시 예는, 마이크로폰이 탑재되어 있는 웨어러블 기기(120)를 통해 음성 명령을 전달하여 보안 인증이 이루어지도록 하는 경우이다.
사용자(110)는 원격지에 위치한 자동차(100)를 음성 인식 비서 서비스를 통해 제어하기 위해 목적하는 제어 명령에 해당하는 음성 명령을 발화한다(404). 사용자(110)가 발화한 음성 명령은 웨어러블 기기(120) 및 홈 스피커(130)로 전달된다.
웨어러블 기기(120)는, 사용자(110)의 발화에 의해 생성된 음성 명령을 전달받아 녹음한 후 저장한다(426). 본 발명의 실시 예에서는, 웨어러블 기기(130)에 입력되는 음성 신호의 크기(진폭)로부터 음성 명령의 시작과 종료를 판단한다. 예를 들면, 사람이 일상적으로 하나의 문장을 발화할 때 발화의 시작 시점 및 종료 시점 각각의 음성 신호의 크기(진폭)를 실험을 통해 구하여 일반화하고, 실험 결과에 기초하여 음성 명령의 실제 발화 시의 음성 신호의 크기(진폭)로부터 음성 명령의 시작 시점과 종료 시점을 구분한다.
웨어러블 기기(120)는 웨어러블 기기(120) 자신의 인증 데이터 및 녹음된 음성 명령을 IoT 서버(150)로 전송한다(428). 웨어러블 기기(120)의 인증 데이터는 웨어러블 기기(120)가 사전에 IoT 서버(150)에 등록된 신뢰할 수 있는 기기임을 나타내는 근거가 된다. IoT 서버(150)는 웨어러블 기기(120)의 인증 데이터를 확인함으로써 해당 웨어러블 기기(120)가 사전에 등록된 신뢰할 수 있는 기기인 것으로 판단한다.
홈 스피커(130)는, 사용자(110)의 발화에 의해 생성된 음성 명령을 전달받아 스피치-텍스트 변환을 수행한다(442). 스피치-텍스트 변환은 사용자(110)가 발화한 음성 신호 형태의 명령을 텍스트 데이터 형태로 변환하는 것이다. 즉, 사용자(110)의 발화에 의해 생성되는 음성 명령은 홈 스피커(130)를 통해 제 1 텍스트 데이터(제 1 STT)로 변환된다. 홈 스피커(130)에서의 변환을 통해 생성되는 제 1 텍스트 데이터(제 1 STT)는 IoT 서버(150)로 전송된다(444).
IoT 서버(150)는, 홈 스피커(130)로부터 전송되는 제 1 텍스트 데이터(제 1 STT)를 수신하여 저장한다(468). 또한 IoT 서버(150)는, 앞서 웨어러블 기기(120)로부터 전송되는 인증 데이터 및 녹음된 음성 명령을 수신하여 저장한다(470). IoT 서버(150)는 웨어러블 기기(120)로부터 수신한 인증 데이터의 분석을 통해 웨어러블 기기(120)가 사전에 등록된 신뢰할 수 있는 기기임을 확인함으로써 웨어러블 기기(120)의 인증을 수행한다(472). 또한 IoT 서버(150)는 웨어러블 기기(120)로부터 수신한 녹음된 음성 명령을 대상으로 스피치-텍스트 변환을 수행한다(474). 스피치-텍스트 변환은 사용자(110)가 발화한 음성 신호 형태의 명령을 텍스트 데이터 형태로 변환하는 것이다. 즉, 사용자(110)의 발화에 의해 생성되는 음성 명령은 IoT 서버(150)에서 제 2 텍스트 데이터(제 2 STT)로 변환된다.
즉, 사용자(110)의 발화에 의해 생성되는 단일의 음성 명령이 홈 스피커(130)와 IoT 서버(150)에서 서로 별개인 두 개의 텍스트 데이터(제 1 STT & 제 2 STT)로 변환된다. 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT)는 서로 별개의 텍스트 데이터이지만 단일의 음성 명령으로부터 생성된 것이므로, 정상적이라면 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT) 각각의 내용(의미)은 서로 동일해야 한다.
IoT 서버(150)는, 홈 스피커(130)를 경유하는 경로를 통해 생성되는 제 1 텍스트 데이터(제 1 STT)와 웨어러블 기기(120)를 경유하는 경로를 통해 생성되는 제 2 텍스트 데이터(제 2 STT)가 서로 일치하는지를 비교한다(476).
앞서 언급한 것처럼, 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT)는 단일의 음성 명령으로부터 생성된 것이어서 내용(의미)이 서로 동일해야 한다. 따라서, 만약 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT)가 서로 동일하면(476의 '예'), IoT 서버(150)는 제 1 텍스트 데이터(제 1 STT)를 텔레매틱스 서버(160)로 전송함으로써 음성 명령이 텔레매틱스 서버(160)를 통해 자동차(100)로 전달될 수 있도록 한다(478). 이 때 제 1 텍스트 데이터(제 1 STT) 대신 제 2 텍스트 데이터(제 2 STT)를 텔레매틱스 서버(478)로 전송해도 좋다. 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT)가 서로 동일한 것으로 판명된 경우이므로, 제 1 텍스트 데이터(제 1 STT)와 제 2 텍스트 데이터(제 2 STT) 가운데 어느 것으로 텔레매틱스 서버(160)로 전송하더라도 정상적인 제어가 이루어질 수 있다.
텔레매틱스 서버(160)는, IoT 서버(150)로부터 전송되는 제 1 텍스트 데이터(제 1 STT)(또는 제 2 텍스트 데이터(제 2 STT))를 수신하여 해당 제어 명령을 자동차(100)로 전송함으로써, 사용자(110)의 발화에 의해 생성되는 음성 명령에 해당하는 자동차(100)의 제어가 이루어질 수 있도록 한다.
이처럼, 사용자(110)는 홈 스피커(130)를 통해 음성 명령을 발생시키는데 있어서 별도의 패스워드(예를 들면 핀 코드)를 직접 발화하지 않고 웨어러블 기기(120)를 통해 외부로 표출되지 않는 사용자 인증을 수행함으로써 음성 명령 시스템의 보안성을 높게 유지할 수 있다.
도 5는 도 3에 나타낸 자동차 제어 방법의 제 2 실시 예를 나타낸 도면이다. 도 5에 나타낸 제 2 실시 예는, 웨어러블 기기(120)가 마이크로폰을 구비하고 있지 않은 경우에 웨어러블 기기(120)를 통해 제스처 이벤트를 생성하여 보안 인증을 수행하는 경우이다.
사용자(110)는 웨어러블 기기(120)를 착용(휴대)한 채 움직임을 발생시켜서 미리 약속된 제스처 이벤트를 생성한다(502). 예를 들면, 웨어러블 기기(120)를 3회에 걸쳐 짧게 흔들면 음성 명령을 발생시키기 위한 제스처인 것으로 미리 약속되어 있을 때, 사용자(110)는 웨어러블 기기(120)를 3회에 걸쳐 짧게 흔들어서 음성 명령의 발생을 예고할 수 있다. 이와 같은 제스처 이벤트의 생성은 웨어러블 기기(120)가 자이로 센서와 같은 움직임 센서를 구비하는 것을 전제로 한다. 자이로 센서 대신 비전 센서 또는 광 센서 등을 통해 사용자(110)의 신체의 일부가 움직이는 것을 감지함으로써 제스처 이벤트가 생성될 수도 있다.
웨어러블 기기(120)를 이용한 제스처 이벤트 생성 후, 사용자(110)는 원격지에 위치한 자동차(100)를 음성 인식 비서 서비스를 통해 제어하기 위해 목적하는 제어 명령에 해당하는 음성 명령을 발화한다(504). 사용자(110)가 발화한 음성 명령은 홈 스피커(130)로 전달된다.
웨어러블 기기(130)는, 제스처 이벤트의 발생에 응답하여 웨어러블 기기(120) 자신의 인증 데이터 및 제스처 이벤트 데이터를 IoT 서버(150)로 전송한다(528). 웨어러블 기기(120)의 인증 데이터는 웨어러블 기기(120)가 사전에 IoT 서버(150)에 등록된 신뢰할 수 있는 기기임을 나타내는 근거가 된다. IoT 서버(150)는 웨어러블 기기(120)의 인증 데이터를 확인함으로써 해당 웨어러블 기기(120)가 사전에 등록된 신뢰할 수 있는 기기인 것으로 판단한다.
홈 스피커(130)는, 사용자(110)의 발화에 의해 생성된 음성 명령을 전달받아 스피치-텍스트 변환을 수행한다(542). 스피치-텍스트 변환은 사용자(110)가 발화한 음성 신호 형태의 명령을 텍스트 데이터 형태로 변환하는 것이다. 즉, 사용자(110)의 발화에 의해 생성되는 음성 명령은 홈 스피커(130)를 통해 텍스트 데이터(STT)로 변환된다. 홈 스피커(130)에서의 변환을 통해 생성되는 텍스트 데이터(STT)는 IoT 서버(150)로 전송된다(544).
IoT 서버(150)는, 앞서 웨어러블 기기(120)로부터 전송되는 인증 데이터 및 제스처 이벤트 데이터 수신하여 저장한다(560). IoT 서버(150)는 웨어러블 기기(120)로부터 수신한 인증 데이터의 분석을 통해 웨어러블 기기(120)가 사전에 등록된 신뢰할 수 있는 기기임을 확인함으로써 웨어러블 기기(120)의 인증을 수행한다(562). 또한 IoT 서버(150)는, 웨어러블 기기(120)로부터 전송되는 제스처 이벤트 데이터를 수신하고 분석하여 해당 제스처 이벤트가 음성 명령의 발생을 예고하는 것임을 확인한다.
앞에서, 웨어러블 기기(120)를 통해 제스처 이벤트를 생성함으로써 음성 명령의 발생을 예고함을 이미 설명한 바 있다. 본 발명의 실시 예에서는, 음성 명령의 발생을 예고하는 제스처 이벤트를 웨어러블 기기(120)를 통해 발생시킨 후 미리 설정된 일정 시간 내에 입력되는 음성 신호만을 유효한 음성 명령으로 인식한다. 예를 들면 웨어러블 기기(120)를 통한 제스처 이벤트 발생 이후 10초 이내에 입력되는 음성 신호만을 유효한 음성 명령으로 인식한다. 이와 같은 시간 제한은 음성 명령 입력을 위해 무한정 대기하는 상황이 발생하지 않도록 하기 위함이다.
웨어러블 기기(120)를 통한 제스처 이벤트 발생 이후 미리 설정된 시간 내에 음성 명령이 수신되면(564의 '예'), IoT 서버(150)는 홈 스피커(130)로부터 전송되는 텍스트 데이터(STT)를 수신하여 저장한 후 텍스트 데이터(STT)를 텔레매틱스 서버(160)로 전송함으로써 음성 명령이 텔레매틱스 서버(160)를 통해 자동차(100)로 전달될 수 있도록 한다(568).
텔레매틱스 서버(160)는, IoT 서버(150)로부터 전송되는 텍스트 데이터(STT)를 수신하여 해당 제어 명령을 자동차(100)로 전송함으로써, 사용자(110)의 발화에 의해 생성되는 음성 명령에 해당하는 자동차(100)의 제어가 이루어질 수 있도록 한다.
이처럼, 사용자(110)는 홈 스피커(130)를 통해 음성 명령을 발생시키는데 있어서 별도의 패스워드(예를 들면 핀 코드)를 직접 발화하지 않고 타인이 쉽게 인지하지 못하도록 웨어러블 기기(120)를 통해 사용자 인증을 수행함으로써 음성 명령 시스템의 보안성을 높게 유지할 수 있다.
위의 설명은 기술적 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명의 기술 분야에서 통상의 지식을 가진 자라면 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서 위에 개시된 실시 예 및 첨부된 도면들은 기술적 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예 및 첨부된 도면에 의하여 기술적 사상의 범위가 한정되는 것은 아니다. 그 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술적 사상은 권리 범위에 포함되는 것으로 해석되어야 할 것이다.
100 : 자동차
110 : 사용자
120 : 웨어러블 기기
122 : 음성 신호 처리부(웨어러블 기기)
124 : 움직임 센서
130 : 홈 스피커
132 : 음성 신호 처리부(홈 스피커)
134 : TTS 처리부
140 : 주거 공간
150 : IoT 서버
152 : 웨어러블 기기 인증 데이터베이스
154 : 음성 저장부
156 : 웨어러블 기기 인증 처리부
158 : 명령어 처리부
160 : 텔레매틱스 서버
110 : 사용자
120 : 웨어러블 기기
122 : 음성 신호 처리부(웨어러블 기기)
124 : 움직임 센서
130 : 홈 스피커
132 : 음성 신호 처리부(홈 스피커)
134 : TTS 처리부
140 : 주거 공간
150 : IoT 서버
152 : 웨어러블 기기 인증 데이터베이스
154 : 음성 저장부
156 : 웨어러블 기기 인증 처리부
158 : 명령어 처리부
160 : 텔레매틱스 서버
Claims (19)
- 음성 명령의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 상기 음성 명령을 제 1 서버로 전송하는 단계와;
상기 음성 명령의 발생에 응답하여 휴대용 기기를 경유하는 제 2 경로를 통해 상기 휴대용 기기의 인증 데이터 및 상기 음성 명령을 상기 제 1 서버로 전송하는 단계와;
상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 기기의 인증을 수행하고, 상기 휴대용 기기의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함하는 음성 인식 기반의 자동차 제어 방법. - 제 1 항에 있어서,
상기 음성 명령의 유효성 판단을 위해, 상기 제 1 경로를 통해 전송되는 음성 명령과 상기 제 2 경로를 통해 전송되는 음성 명령을 비교하여 일치 여부를 판단하는 것을 더 포함하는 음성 인식 기반의 자동차 제어 방법. - 제 1 항에 있어서,
상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함하는 음성 인식 기반의 자동차 제어 방법. - 제 3 항에 있어서,
상기 제 2 서버는 텔레매틱스 서버이고;
상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것인 음성 인식 기반의 자동차 제어 방법. - 제 1 항에 있어서,
상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기인 음성 인식 기반의 자동차 제어 방법. - 제 1 항에 있어서,
상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기인 음성 인식 기반의 자동차 제어 방법. - 휴대용 기기에서 제스처 이벤트가 발생하는 단계와;
상기 제스처 이벤트의 발생에 응답하여 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 음성 명령을 제 1 서버로 전송하는 단계와;
상기 제스처 이벤트의 발생에 응답하여 상기 휴대용 기기를 경유하는 제 2 경로를 통해 상기 휴대용 기기의 인증 데이터 및 제스처 이벤트 데이터를 상기 제 1 서버로 전송하는 단계와;
상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 기기의 인증을 수행하고, 상기 휴대용 기기의 인증이 완료되면 상기 음성 명령을 유효한 것으로 인정하는 단계를 포함하는 음성 인식 기반의 자동차 제어 방법. - 제 7 항에 있어서,
상기 제스처 이벤트의 발생 후 미리 설정된 시간 내에 입력되는 음성 신호만을 음성 명령으로 인식하는 음성 인식 기반의 자동차 제어 방법. - 제 7 항에 있어서,
상기 휴대용 기기의 사용자가 신체의 일부를 움직이는 것을 움직임 센서를 통해 감지함으로써 상기 제스처 이벤트가 생성되는 음성 인식 기반의 자동차 제어 방법. - 제 9 항에 있어서, 상기 움직임 센서는,
상기 사용자의 신체의 일부가 움직이는 것을 감지하도록 마련되는 자이로 센서와 비전 센서, 광 센서 가운데 적어도 하나인 음성 인식 기반의 자동차 제어 방법. - 제 7 항에 있어서,
상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함하는 음성 인식 기반의 자동차 제어 방법. - 제 11 항에 있어서,
상기 제 2 서버는 텔레매틱스 서버이고;
상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것인 음성 인식 기반의 자동차 제어 방법. - 제 7 항에 있어서,
상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기인 음성 인식 기반의 자동차 제어 방법. - 제 7 항에 있어서,
상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기인 음성 인식 기반의 자동차 제어 방법. - 음성 인식 서비스 장치를 경유하는 제 1 경로를 통해 음성 명령을 제 1 서버로 전송하는 단계와;
휴대용 기기를 경유하는 제 2 경로를 통해 상기 휴대용 기기의 인증 데이터를 상기 제 1 서버로 전송하는 단계와;
상기 제 1 서버에서 상기 인증 데이터에 기초한 상기 휴대용 기기의 인증을 수행하고, 상기 휴대용 기기의 인증 결과에 따라 상기 음성 명령의 유효성을 판단하는 단계를 포함하는 음성 인식 제어 방법. - 제 15 항에 있어서,
상기 음성 명령이 유효한 것으로 판단되면 상기 음성 명령을 제 2 서버로 전송하여 상기 음성 명령에 해당하는 제어가 이루어지도록 하는 단계를 더 포함하는 음성 인식 제어 방법. - 제 16 항에 있어서,
상기 제 2 서버는 텔레매틱스 서버이고;
상기 음성 명령을 통한 제어는 상기 텔레매틱스 서버에 등록된 자동차를 제어하는 것인 음성 인식 제어 방법. - 제 15 항에 있어서,
상기 음성 인식 서비스 장치는 음성 인식 비서 서비스를 제공하는 IoT 기기인 음성 인식 제어 방법. - 제 15 항에 있어서,
상기 휴대용 기기는 음성 입력과 제스처 인식 가운데 적어도 하나의 기능을 가진 웨어러블 기기인 음성 인식 제어 방법.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170133259A KR102417524B1 (ko) | 2017-10-13 | 2017-10-13 | 음성 인식 기반의 자동차 제어 방법 |
US15/834,678 US10446152B2 (en) | 2017-10-13 | 2017-12-07 | Speech recognition-based vehicle control method |
CN201711372888.1A CN109664847B (zh) | 2017-10-13 | 2017-12-19 | 基于语音识别的车辆控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170133259A KR102417524B1 (ko) | 2017-10-13 | 2017-10-13 | 음성 인식 기반의 자동차 제어 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190041710A KR20190041710A (ko) | 2019-04-23 |
KR102417524B1 true KR102417524B1 (ko) | 2022-07-07 |
Family
ID=66097020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170133259A KR102417524B1 (ko) | 2017-10-13 | 2017-10-13 | 음성 인식 기반의 자동차 제어 방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10446152B2 (ko) |
KR (1) | KR102417524B1 (ko) |
CN (1) | CN109664847B (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7192208B2 (ja) * | 2017-12-01 | 2022-12-20 | ヤマハ株式会社 | 機器制御システム、デバイス、プログラム、及び機器制御方法 |
JP6962158B2 (ja) | 2017-12-01 | 2021-11-05 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
JP7067082B2 (ja) | 2018-01-24 | 2022-05-16 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
US10735463B2 (en) * | 2018-09-13 | 2020-08-04 | International Business Machines Corporation | Validating commands for hacking and spoofing prevention in an Internet of Things (IoT) computing environment |
KR20230007138A (ko) * | 2021-07-05 | 2023-01-12 | 현대자동차주식회사 | 차량 품질 문제 관리 시스템 및 그의 데이터 처리 방법 |
DE102021119682A1 (de) | 2021-07-29 | 2023-02-02 | Audi Aktiengesellschaft | System und Verfahren zur Sprachkommunikation mit einem Kraftfahrzeug |
KR102635031B1 (ko) * | 2023-09-27 | 2024-02-13 | 주식회사 에이아이노미스 | 의미 단위 시각화를 기반으로 한 화자 분리 실시간 통역 서비스 제공 방법, 장치 및 시스템 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170083285A1 (en) | 2015-09-21 | 2017-03-23 | Amazon Technologies, Inc. | Device selection for providing a response |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9489671B2 (en) * | 2002-10-01 | 2016-11-08 | Andrew H B Zhou | Systems and methods for mobile application, wearable application, transactional messaging, calling, digital multimedia capture and payment transactions |
US7529677B1 (en) * | 2005-01-21 | 2009-05-05 | Itt Manufacturing Enterprises, Inc. | Methods and apparatus for remotely processing locally generated commands to control a local device |
KR20110038563A (ko) | 2009-10-08 | 2011-04-14 | 최운호 | 운전자 인증을 통한 차량 제어 방법, 차량 단말기, 생체인식 카드 및 시스템과, 생체인식 카드와 단말기를 이용한 탑승자 보호 추적 기능을 제공하는 방법 |
KR20130133629A (ko) * | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
KR101330671B1 (ko) * | 2012-09-28 | 2013-11-15 | 삼성전자주식회사 | 전자장치, 서버 및 그 제어방법 |
KR101893224B1 (ko) | 2012-10-29 | 2018-08-29 | 르노삼성자동차 주식회사 | 모바일 기기의 인증 방법 및 이를 포함하는 차량과 모바일 기기의 통신 방법 |
JP5902632B2 (ja) * | 2013-01-07 | 2016-04-13 | 日立マクセル株式会社 | 携帯端末装置及び情報処理システム |
US10212207B2 (en) * | 2013-08-21 | 2019-02-19 | At&T Intellectual Property I, L.P. | Method and apparatus for accessing devices and services |
US9760698B2 (en) * | 2013-09-17 | 2017-09-12 | Toyota Motor Sales, U.S.A., Inc. | Integrated wearable article for interactive vehicle control system |
US10133548B2 (en) | 2014-01-27 | 2018-11-20 | Roadwarez Inc. | System and method for providing mobile personal security platform |
JP2015153258A (ja) | 2014-02-17 | 2015-08-24 | パナソニックIpマネジメント株式会社 | 車両用個人認証システム及び車両用個人認証方法 |
US9826400B2 (en) * | 2014-04-04 | 2017-11-21 | Qualcomm Incorporated | Method and apparatus that facilitates a wearable identity manager |
KR102193029B1 (ko) * | 2014-05-09 | 2020-12-18 | 삼성전자주식회사 | 디스플레이 장치 및 그의 화상 통화 수행 방법 |
DE112015003882B4 (de) * | 2014-08-26 | 2023-04-27 | Toyota Motor Sales, U.S.A., Inc. | Integrierter tragbarer Artikel für interaktives Fahrzeugsteuerungssystem |
KR20160041521A (ko) | 2014-10-08 | 2016-04-18 | 이계정 | 스마트폰과 차량용 블랙박스를 통합제어하는 시설보안 시스템 및 그 방법 |
US9525675B2 (en) * | 2014-12-26 | 2016-12-20 | Mcafee, Inc. | Encryption key retrieval |
US10095834B2 (en) * | 2015-05-08 | 2018-10-09 | YC Wellness, Inc. | Integration platform and application interfaces for remote data management and security |
CN106469040B (zh) * | 2015-08-19 | 2019-06-21 | 华为终端有限公司 | 通信方法、服务器及设备 |
US9747926B2 (en) * | 2015-10-16 | 2017-08-29 | Google Inc. | Hotword recognition |
US9728188B1 (en) * | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
US10491598B2 (en) * | 2016-06-30 | 2019-11-26 | Amazon Technologies, Inc. | Multi-factor authentication to access services |
NO341956B1 (en) * | 2016-08-09 | 2018-03-05 | No Isolation As | A system for providing virtual participation in a remote environment |
US10566007B2 (en) * | 2016-09-08 | 2020-02-18 | The Regents Of The University Of Michigan | System and method for authenticating voice commands for a voice assistant |
US10607230B2 (en) * | 2016-12-02 | 2020-03-31 | Bank Of America Corporation | Augmented reality dynamic authentication for electronic transactions |
KR20170007223A (ko) * | 2016-12-15 | 2017-01-18 | 주식회사 엘지유플러스 | 확장 음성 인식 서비스를 제공하는 포터블 디바이스 및 도킹 스테이션 |
US10186266B1 (en) * | 2016-12-28 | 2019-01-22 | Amazon Technologies, Inc. | Message playback using a shared device |
US10534429B2 (en) * | 2017-01-10 | 2020-01-14 | International Business Machines Corporation | Method of instant sharing invoked from wearable devices |
US10268207B2 (en) * | 2017-03-10 | 2019-04-23 | Ford Global Technologies, Llc | Autonomous vehicle network bandwidth bridging |
US10459687B2 (en) * | 2017-03-28 | 2019-10-29 | Wipro Limited | Method and system for controlling an internet of things device using multi-modal gesture commands |
US10902848B2 (en) * | 2017-07-20 | 2021-01-26 | Hyundai Autoever America, Llc. | Method for providing telematics service using voice recognition and telematics server using the same |
-
2017
- 2017-10-13 KR KR1020170133259A patent/KR102417524B1/ko active IP Right Grant
- 2017-12-07 US US15/834,678 patent/US10446152B2/en active Active
- 2017-12-19 CN CN201711372888.1A patent/CN109664847B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170083285A1 (en) | 2015-09-21 | 2017-03-23 | Amazon Technologies, Inc. | Device selection for providing a response |
Also Published As
Publication number | Publication date |
---|---|
US20190115017A1 (en) | 2019-04-18 |
CN109664847A (zh) | 2019-04-23 |
US10446152B2 (en) | 2019-10-15 |
CN109664847B (zh) | 2023-03-07 |
KR20190041710A (ko) | 2019-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102417524B1 (ko) | 음성 인식 기반의 자동차 제어 방법 | |
KR102513297B1 (ko) | 전자 장치 및 전자 장치의 기능 실행 방법 | |
KR102142642B1 (ko) | 차량 환경에서의 다중 인자 인증 및 액세스 제어 | |
US11257502B2 (en) | Providing access with a portable device and voice commands | |
US10062388B2 (en) | Acoustic and surface vibration authentication | |
US9418664B2 (en) | System and method of speaker recognition | |
US20130127591A1 (en) | Secure facilities access | |
CN109997185A (zh) | 用于电子设备中的生物测定认证的方法和装置 | |
AU2019403389B2 (en) | Audio-based access control | |
KR20160124833A (ko) | 모바일 디바이스들을 위한 신뢰 브로커 인증 방법 | |
US20160300050A1 (en) | Verifying a user with biometric data | |
US10988115B2 (en) | Systems and methods for providing vehicle access using biometric data | |
JP2006505021A (ja) | 安全なアプリケーション環境のためのローバスト多要素認証 | |
US11010999B2 (en) | Systems and methods for voice-activated control of an access control platform | |
JP2015153258A (ja) | 車両用個人認証システム及び車両用個人認証方法 | |
US20200410077A1 (en) | Method and apparatus for dynamically adjusting biometric user authentication for accessing a communication device | |
US11170790B2 (en) | User authentication with audio reply | |
US20190385618A1 (en) | Vehicle authentication device and vehicle control system | |
KR20140011881A (ko) | 제어권 이동을 통한 원격제어시스템 및 방법 | |
JP7287269B2 (ja) | 車両用通信システム | |
KR20180133048A (ko) | 차량용 키, 차량, 차량용 키를 이용한 인증 시스템 및 인증 방법 | |
WO2024172809A1 (en) | Configurable vehicle authorization using local biometric authentication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |