WO2020251116A1 - 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법 - Google Patents

음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법 Download PDF

Info

Publication number
WO2020251116A1
WO2020251116A1 PCT/KR2019/013433 KR2019013433W WO2020251116A1 WO 2020251116 A1 WO2020251116 A1 WO 2020251116A1 KR 2019013433 W KR2019013433 W KR 2019013433W WO 2020251116 A1 WO2020251116 A1 WO 2020251116A1
Authority
WO
WIPO (PCT)
Prior art keywords
voice recognition
wake
signal
accessory
mobile terminal
Prior art date
Application number
PCT/KR2019/013433
Other languages
English (en)
French (fr)
Inventor
안성민
박동길
윤기민
Original Assignee
주식회사 오투오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 오투오 filed Critical 주식회사 오투오
Priority to US17/418,841 priority Critical patent/US20220059079A1/en
Publication of WO2020251116A1 publication Critical patent/WO2020251116A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication

Definitions

  • the present invention relates to a system and method for providing a predetermined service, and more particularly, to a system and method for providing a service using a voice recognition accessory.
  • Apple's iPhone and Samsung's Galaxy phone provide AI assistant services using call languages such as Siri or Bixby.
  • the AI assistant service application of Apple or Galaxy is automatically launched.
  • the mobile phone since the mobile phone must continuously receive the surrounding voice and recognize the call word, the accuracy of recognition is very important.
  • Patent Document 1 Unexamined Patent Publication 10-2014-0102339
  • Patent Document 2 Registered Patent Publication 10-1560448
  • An object of the present invention is to provide a service providing system using a voice recognition accessory.
  • Another object of the present invention is to provide a service providing method using a voice recognition accessory.
  • the service providing system using the voice recognition accessory is a voice recognition accessory that recognizes a user's voice, generates a wake-up signal corresponding to the recognized voice, and transmits in real time.
  • voice recognition accessory A mobile terminal for receiving a wake-up signal from the voice recognition accessory in real time to recognize a wake-up signal, and to run an application according to the recognized wake-up signal; It may be configured to include a service providing server that provides a corresponding service by communicating with an application running in the mobile terminal.
  • the application and the service providing server may be separately provided for each corresponding service.
  • the voice recognition accessory may be configured to transmit a wake-up signal to the mobile terminal using Bluetooth communication.
  • a service providing method using a voice recognition accessory includes the steps of: a voice recognition accessory to recognize a user's voice; Generating, by the voice recognition accessory, a wake-up signal corresponding to the recognized voice; The voice recognition accessory transmitting the generated wake-up signal to a mobile terminal in real time, and the mobile terminal receiving a wake-up signal from the voice recognition accessory in real time; Recognizing a wake-up signal received in real time by the mobile terminal and operating an application according to the recognized wake-up signal; It may be configured to include, by a service providing server, providing a service by an application operated on the mobile terminal to the mobile terminal.
  • the application and the service providing server may be separately provided for each corresponding service.
  • Bluetooth Bluetooth
  • the caller is input at a distance away from the mobile phone, thereby increasing the recognition rate of the caller and There is an effect that can smoothly provide AI services.
  • FIG. 1 is a block diagram of a service providing system using a voice recognition accessory according to an embodiment of the present invention.
  • FIG. 2 is a flowchart of a service providing method using a voice recognition accessory according to an embodiment of the present invention.
  • first, second, A, and B may be used to describe various elements, but the elements should not be limited by the terms. These terms are used only for the purpose of distinguishing one component from another component. For example, without departing from the scope of the present invention, a first element may be referred to as a second element, and similarly, a second element may be referred to as a first element.
  • the term and/or includes a combination of a plurality of related listed items or any of a plurality of related listed items.
  • FIG. 1 is a block diagram of a service providing system using a voice recognition accessory according to an embodiment of the present invention.
  • a service providing system 100 using a voice recognition accessory includes a voice recognition accessory 110, a mobile terminal 120, and a service providing server 130. It may be configured to include.
  • the service providing system 100 using the voice recognition accessory is configured to call a specific application 10 by making a voice input using the voice recognition accessory 110 capable of Bluetooth communication with the mobile terminal 120.
  • voice commands can be input using the voice recognition accessory 110 to increase the voice recognition rate, and users can conveniently enjoy AI services while moving within a predetermined space.
  • the voice recognition accessory 110 may be configured to receive and recognize a user's voice.
  • the voice recognition accessory 110 may be configured to have a Bluetooth connection with the mobile terminal 120, and may be configured to be conveniently carried by a user or attached to a body.
  • it may be manufactured in a shape such as a necklace type or a band type.
  • the voice recognition accessory 110 is configured to recognize a user's call word, and may be configured to generate a wake-up signal corresponding to the call word and transmit it to the mobile terminal 120 in real time.
  • the voice recognition accessory 110 may be configured to be connected to the mobile terminal 120 via Bluetooth, and the wake-up signal may be transmitted through Bluetooth communication.
  • the voice recognition accessory 110 includes a microphone 111, an acoustic echo cancellation (AEC) processing module 112, a voice recognition module 113, a pager detection module 114, a pager database 115, and Bluetooth. It may be configured to include a communication module 116 and a pager input/storage module 117.
  • AEC acoustic echo cancellation
  • the microphone 111 may be configured to receive a user's voice.
  • the user's voice may include a pager or voice command.
  • the AEC processing module 112 may be configured to output by removing noise and echo from a voice input from the microphone 111.
  • the voice recognition module 113 may be configured to recognize a voice output from the AEC processing module 112. Here, the voice recognition module 113 may be configured to identify whether or not the user's voice is voiced by analyzing a voice frequency. The voice recognition module 113 may be configured to enable a subsequent operation only when it is recognized as the user's voice.
  • the pager detection module 114 may be configured to detect a pager in the voice recognized by the voice recognition module 113 using a keyword spotting algorithm.
  • the pager detection module 114 may be configured to detect a pager when the voice recognition module 113 recognizes the user's voice.
  • the pager detection module 114 may be configured to detect a pager by referring to a pager previously stored in the pager database 115.
  • a caller for waking up the AI assistant application or other application 10 may be previously mapped and stored.
  • the Bluetooth communication module 116 may be configured to perform Bluetooth communication with the mobile terminal 120.
  • the Bluetooth communication module 116 may be configured to transmit the page word detected by the page word detection module 114 to the mobile terminal 120 in real time.
  • the voice recognition module 113 may be configured to enter the voice command standby mode after the page word detection module 114 detects the call word.
  • the voice recognized in the voice command standby mode can be recognized as a voice command.
  • the Bluetooth communication module 116 may be configured to transmit a voice command recognized by the voice recognition module 113 to the mobile terminal 120.
  • the Bluetooth communication module 116 may be configured to receive a call word newly input and set by a user from the mobile terminal 120.
  • the pager input/storage module 117 may be configured to update and store the pager received from the Bluetooth communication module 116 into the pager database 115.
  • the mobile terminal 120 may be configured to receive and recognize a wake-up signal in real time from the voice recognition accessory 110 and execute the application 10 corresponding to the wake-up signal.
  • the voice recognition accessory 110 or mobile terminal 120 described above may be separately provided for each AI service or application 10.
  • the mobile terminal 120 includes a Bluetooth communication module 121, a call word recognition module 122, a call word-application database 123, an application execution module 124, a voice command transmission module 125, and a mobile communication module 126. ), a microphone 127, a voice recognition module 128, and a call word input/storage control module 129.
  • a Bluetooth communication module 121 a Bluetooth communication module 121, a call word recognition module 122, a call word-application database 123, an application execution module 124, a voice command transmission module 125, and a mobile communication module 126.
  • a microphone 127 a microphone 127
  • a voice recognition module 128, and a call word input/storage control module 129 a call word input/storage control module 129.
  • the Bluetooth communication module 121 may be configured to perform Bluetooth communication with the voice recognition accessory 110.
  • the Bluetooth communication module 121 may be configured to receive a pager from the voice recognition accessory 110.
  • the pager recognition module 122 may be configured to recognize a pager received from the Bluetooth communication module 121.
  • the caller recognition module 122 may be configured to recognize which application 10 is a caller by referring to a corresponding pair of caller-applications stored in the caller-application database 123.
  • the caller-application database 123 may be configured to store a corresponding pair of caller-applications in advance.
  • the AI service application of Apple's iPhone may be stored in correspondence with the caller'Siri'.
  • the AI service application of Samsung's Galaxy phone can be stored in correspondence with the call word'Bixby'.
  • the application execution module 124 may be configured to wake-up and execute the application 10 corresponding to the caller recognized by the caller recognition module 122.
  • the voice command delivery module 125 transmits and inputs a user's voice command for performing the function of the application 10 to the application 10 while the specific application 10 is executed by the application execution module 124 Can be configured to
  • the user's voice command may be received from the voice recognition accessory 110 through the Bluetooth communication module 121.
  • the application 10 may need to receive necessary services from the service providing server 130 of the application 10.
  • the application 10 may be configured to communicate with the service providing server 130.
  • the application 10 may be configured to transmit a user's voice command to the service providing server 130 through the mobile communication module 126.
  • the voice command is a specific search command
  • the search command may be transmitted to the service providing server 130.
  • the microphone 127 is a component for receiving a user's voice.
  • the microphone 127 may be used when a user wants to directly designate a call word for waking up a specific application 10.
  • the voice recognition module 128 may be configured to recognize a voice input from the microphone 127.
  • voice may be a pager.
  • the caller input/storage control module 129 may be configured to update and store the caller recognized by the voice recognition module 128 in the caller-application database 123.
  • the user may directly input and set a call word for each application 10 installed in the mobile terminal 120, and the user may change and store an existing call word such as'Siri' or'Bixby'. Specific call words that only the user should know can be saved by new or changed.
  • the application lock setting module may be configured to lock a specific application 10 according to a user's input.
  • the locked application 10 may be configured to wake-up and execute only when the user calls it. That is, the locked application 10 is not unlocked by pattern input, password input, or fingerprint input, but the application 10 is unlocked and executed only by the user's voice fingerprint and the caller directly designated by the user. I can.
  • the application 10 may be securely protected by a user's voice fingerprint as well as a double security setting of the user's caller.
  • the caller input/storage control module 129 is configured to transmit the caller to the voice recognition accessory 110 through the Bluetooth communication module 121 from the caller-application correspondence pair stored in the caller-application database 123.
  • the voice recognition accessory 110 may be configured to receive a call word from the mobile terminal 120 and store the update in the call word database 115.
  • the service providing server 130 is configured to communicate with a specific application 10 of the mobile terminal 120 and may be configured to provide a service requested by the application 10.
  • FIG. 2 is a flowchart of a service providing method using a voice recognition accessory according to an embodiment of the present invention.
  • a voice recognition accessory (voice recognition accessory) 110 recognizes the user's call word (S101).
  • the voice recognition accessory 110 generates a wake-up signal corresponding to the recognized call word (S102).
  • the voice recognition accessory 110 transmits the generated wake-up signal to the mobile terminal 120 in real time, and the mobile terminal 120 receives the wake-up signal from the voice recognition accessory 110 in real time (S103 ).
  • the voice recognition accessory 110 and the mobile terminal 120 may be configured to transmit and receive a wake-up signal using Bluetooth communication.
  • the mobile terminal 120 recognizes the wake-up signal received in real time, and operates the application 10 according to the recognized wake-up signal (S104).
  • the service providing server 130 provides a service by the application 10 operated on the mobile terminal 120 to the mobile terminal 120 (S105).
  • the application 10 and the service providing server 130 may be separately provided for each corresponding service.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법이 개시된다. 사용자의 음성을 인식하고, 인식된 음성에 대응되는 웨이크-업 시그널(wake-up signal)을 생성하여 실시간 송신하는 음성 인식 액세서리(voice recognition accessory); 상기 음성 인식 액세서리로부터 웨이크-업 시그널을 실시간 수신하여 웨이크-업 시그널을 인식하고, 인식된 웨이크-업 시그널에 따른 어플리케이션이 구동되는 모바일 단말(mobile terminal); 상기 모바일 단말에서 구동되는 어플리케이션과 통신하여 해당 서비스를 제공하는 서비스 제공 서버를 구성한다. 상술한 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법에 의하면, 사용자가 쉽게 소지할 수 있는 음성 인식 액세서리를 이용하여 모바일 폰에서 떨어진 거리에서 호출어를 입력받도록 구성됨으로써, 호출어의 인식률을 높이고 모바일 폰의 AI 서비스를 원활하게 제공할 수 있는 효과가 있다. 특히, 음성 명령의 인식률도 높일 수 있으므로, AI 비서 어플리케이션을 다소 떨어진 거리에서도 원활하게 이용할 수 있는 효과가 있다. 아울러, 다양한 어플리케이션에 대한 호출어를 직접 입력하여 설정하도록 구성됨으로써, 사용자가 자주 사용하는 어플리케이션을 쉽게 사용할 수 있는 효과가 있다.

Description

음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법
본 발명은 소정의 서비스를 제공하는 시스템 및 방법에 관한 것으로서, 구체적으로는 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법에 관한 것이다.
애플(Apple)의 아이폰이나 삼성의 갤럭시(Galaxy)폰은 시리나 빅스비와 같은 호출어를 이용하여 AI 비서 서비스를 제공하고 있다.
사용자가 시리나 빅스비라는 호출어를 발음하면 애플이나 갤럭시의 AI 비서 서비스 어플리케이션이 자동으로 실행된다.
여기서, 모바일 폰에서 주변의 음성을 지속적으로 입력받아 호출어를 인식해야 하므로, 인식의 정확도가 매우 중요하다.
그러나, 사용자가 모바일 폰에서 다소 떨어진 거리에 있는 경우, 다소 떨어진 거리에서 호출어를 발음하기 때문에 호출어의 인식률이 낮아지는 문제점이 있다.
그리고 다소 떨어진 거리에서는 구체적인 음성 명령에 대한 인식률도 저하되는 문제점이 있다.
이에, 사용자의 움직임과 활동 영역을 좀 더 넓힌 상태에서도 원활한 AI 서비스를 제공할 수 있는 수단이 요구된다.
[선행기술문헌]
[특허문헌]
(특허문헌 1) 공개특허공보 10-2014-0102339
(특허문헌 2) 등록특허공보 10-1560448
본 발명의 목적은 음성 인식 액세서리를 이용한 서비스 제공 시스템을 제공하는 데 있다.
본 발명의 다른 목적은 음성 인식 액세서리를 이용한 서비스 제공 방법을 제공하는 데 있다.
상술한 본 발명의 목적에 따른 음성 인식 액세서리를 이용한 서비스 제공 시스템은, 사용자의 음성을 인식하고, 인식된 음성에 대응되는 웨이크-업 시그널(wake-up signal)을 생성하여 실시간 송신하는 음성 인식 액세서리(voice recognition accessory); 상기 음성 인식 액세서리로부터 웨이크-업 시그널을 실시간 수신하여 웨이크-업 시그널을 인식하고, 인식된 웨이크-업 시그널에 따른 어플리케이션이 구동되는 모바일 단말(mobile terminal); 상기 모바일 단말에서 구동되는 어플리케이션과 통신하여 해당 서비스를 제공하는 서비스 제공 서버를 포함하도록 구성될 수 있다.
여기서, 상기 어플리케이션 및 서비스 제공 서버는, 상기 해당 서비스 별로 각각 별도로 구비될 수 있다.
그리고 상기 음성 인식 액세서리는, 블루투스(Bluetooth) 통신을 이용하여 웨이크-업 시그널을 상기 모바일 단말로 송신하도록 구성될 수 있다.
상술한 본 발명의 다른 목적에 따른 음성 인식 액세서리를 이용한 서비스 제공 방법은, 음성 인식 액세서리(voice recognition accessory)가 사용자의 음성을 인식하는 단계; 상기 음성 인식 액세서리가 상기 인식된 음성에 대응되는 웨이크-업 시그널(wake-up signal)을 생성하는 단계; 상기 음성 인식 액세서리가 상기 생성된 웨이크-업 시그널을 모바일 단말로 실시간 송신하고, 상기 모바일 단말이 상기 음성 인식 액세서리로부터 웨이크-업 시그널을 실시간 수신하는 단계; 상기 모바일 단말이 실시간 수신된 웨이크-업 시그널을 인식하고, 인식된 웨이크-업 시그널에 따른 어플리케이션을 동작시키는 단계; 서비스 제공 서버가 상기 모바일 단말에서 동작되는 어플리케이션에 의한 서비스를 상기 모바일 단말로 제공하는 단계를 포함하도록 구성될 수 있다.
여기서, 상기 어플리케이션 및 서비스 제공 서버는, 상기 해당 서비스 별로 각각 별도로 구비될 수 있다.
그리고 상기 음성 인식 액세서리가 상기 생성된 웨이크-업 시그널을 모바일 단말로 실시간 송신하고, 상기 모바일 단말이 상기 음성 인식 액세서리로부터 웨이크-업 시그널을 실시간 수신하는 단계는, 블루투스(Bluetooth) 통신을 이용하여 웨이크-업 시그널을 송수신하도록 구성될 수 있다.
상술한 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법에 의하면, 사용자가 쉽게 소지할 수 있는 음성 인식 액세서리를 이용하여 모바일 폰에서 떨어진 거리에서 호출어를 입력받도록 구성됨으로써, 호출어의 인식률을 높이고 모바일 폰의 AI 서비스를 원활하게 제공할 수 있는 효과가 있다.
특히, 음성 명령의 인식률도 높일 수 있으므로, AI 비서 어플리케이션을 다소 떨어진 거리에서도 원활하게 이용할 수 있는 효과가 있다.
아울러, 다양한 어플리케이션에 대한 호출어를 직접 입력하여 설정하도록 구성됨으로써, 사용자가 자주 사용하는 어플리케이션을 쉽게 사용할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 액세서리를 이용한 서비스 제공 시스템의 블록 구성도이다.
도 2는 본 발명의 실시예에 따른 음성 인식 액세서리를 이용한 서비스 제공 방법의 흐름도이다.
[부호의 설명]
110: 음성 인식 액세서리
111: 마이크로폰
112: AEC 처리 모듈
113: 음성 인식 모듈
114: 호출어 검출 모듈
115: 호출어 데이터베이스
116: 블루투스 통신 모듈
117: 호출어 입력/저장 모듈
120: 모바일 단말
121: 블루투스 통신 모듈
122: 호출어 인식 모듈
123: 호출어-어플리케이션 데이터베이스
124: 어플리케이션 실행 모듈
125: 음성 명령 전달 모듈
126: 이동 통신 모듈
127: 마이크로폰
128: 음성 인식 모듈
129: 호출어 입력/저장 제어 모듈
130: 서비스 제공 서버
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 발명을 실시하기 위한 구체적인 내용에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 음성 인식 액세서리를 이용한 서비스 제공 시스템의 블록 구성도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 음성 인식 액세서리를 이용한 서비스 제공 시스템(100)은 음성 인식 액세서리(voice recognition accessory)(110), 모바일 단말(120), 서비스 제공 서버(130)를 포함하도록 구성될 수 있다.
음성 인식 액세서리를 이용한 서비스 제공 시스템(100)은 모바일 단말(120)과 블루투스 통신이 가능한 음성 인식 액세서리(110)를 이용하여 음성 입력을 하여 특정 어플리케이션(10)을 호출하도록 구성된다.
호출어 외에 기타 음성 명령도 음성 인식 액세서리(110)를 이용하여 입력하도록 하여 음성 인식률을 높이는 것은 물론, 사용자가 편리하게 소정 공간 내에서 움직이면서 AI 서비스를 향유할 수 있다.
이하, 세부적인 구성에 대하여 설명한다.
음성 인식 액세서리(110)는 사용자의 음성을 입력받아 인식하도록 구성될 수 있다.
음성 인식 액세서리(110)는 모바일 단말(120)과 블루투스 연결이 되도록 구성될 수 있으며, 사용자가 편리하게 소지하거나 신체에 부착할 수 있도록 구성될 수 있다.
예를 들어, 목걸이 타입이나 밴드(band) 타입과 같은 형상으로 제조될 수 있다.
음성 인식 액세서리(110)는 사용자의 호출어를 인식하도록 구성되며, 그 호출어에 대응되는 웨이크-업 시그널(wake-up signal)을 생성하여 모바일 단말(120)로 실시간 송신하도록 구성될 수 있다. 여기서, 음성 인식 액세서리(110)는 모바일 단말(120)과 블루투스 연결되도록 구성될 수 있으며, 웨이크-업 시그널은 블루투스 통신을 통해 송신될 수 있다.
음성 인식 액세서리(110)는 마이크로폰(microphone)(111), AEC(acoustic echo cancellation) 처리 모듈(112), 음성 인식 모듈(113), 호출어 검출 모듈(114), 호출어 데이터베이스(115), 블루투스 통신 모듈(116), 호출어 입력/저장 모듈(117)을 포함하도록 구성될 수 있다. 이하, 세부적인 구성에 대하여 설명한다.
마이크로폰(111)은 사용자의 음성을 입력받도록 구성될 수 있다. 사용자의 음성에는 호출어나 음성 명령이 포함될 수 있다.
AEC 처리 모듈(112)은 마이크로폰(111)에서 입력된 음성에서 잡음과 에코를 제거하여 출력하도록 구성될 수 있다.
음성 인식 모듈(113)은 AEC 처리 모듈(112)에서 출력된 음성을 인식하도록 구성될 수 있다. 여기서, 음성 인식 모듈(113)은 음성 주파수를 분석하여 사용자의 음성인지 아닌지를 구별할 수 있도록 구성될 수 있다. 음성 인식 모듈(113)에서 사용자의 음성인 것으로 인식된 경우에만 그 다음의 동작이 가능하도록 구성될 수 있다.
호출어 검출 모듈(114)은 음성 인식 모듈(113)에서 인식된 음성에서 키워드 스폿팅(keyword spotting) 알고리즘을 이용하여 호출어를 검출하도록 구성될 수 있다. 호출어 검출 모듈(114)은 음성 인식 모듈(113)에서 사용자의 음성으로 인식된 경우에 호출어 검출을 하도록 구성될 수 있다.
여기서, 호출어 검출 모듈(114)은 호출어 데이터베이스(115)에 미리 저장된 호출어를 참조하여 호출어를 검출하도록 구성될 수 있다.
호출어 데이터베이스(115)에는 AI 비서 어플리케이션이나 기타 다른 어플리케이션(10)을 웨이크-업(wake-up)하기 위한 호출어가 미리 대응되어 저장될 수 있다.
블루투스 통신 모듈(116)은 모바일 단말(120)과 블루투스 통신을 수행하도록 구성될 수 있다.
블루투스 통신 모듈(116)은 호출어 검출 모듈(114)에서 검출된 호출어를 실시간으로 모바일 단말(120)로 송신하도록 구성될 수 있다.
한편, 음성 인식 모듈(113)은 호출어 검출 모듈(114)에서 호출어가 검출된 이후에 음성 명령 대기 모드로 진입하도록 구성될 수 있다. 음성 명령 대기 모드에서 인식되는 음성은 음성 명령으로 인지할 수 있다.
블루투스 통신 모듈(116)은 음성 인식 모듈(113)에서 인식된 음성 명령을 모바일 단말(120)로 송신하도록 구성될 수 있다.
다른 한편, 블루투스 통신 모듈(116)은 모바일 단말(120)로부터 사용자에 의해 새로 입력되어 설정된 호출어를 수신하도록 구성될 수 있다.
호출어 입력/저장 모듈(117)은 블루투스 통신 모듈(116)에서 수신되는 호출어를 호출어 데이터베이스(115)에 입력하여 갱신 저장하도록 구성될 수 있다.
모바일 단말(120)은 음성 인식 액세서리(110)로부터 웨이크-업 시그널을 실시간 수신하여 인식하고, 그 웨이크-업 시그널에 대응되는 어플리케이션(10)을 실행하도록 구성될 수 있다.
앞서 설명한 음성 인식 액세서리(110)나 모바일 단말(120)은 AI 서비스나 어플리케이션(10)마다 각각 별도로 구비될 수 있다.
모바일 단말(120)은 블루투스 통신 모듈(121), 호출어 인식 모듈(122), 호출어-어플리케이션 데이터베이스(123), 어플리케이션 실행 모듈(124), 음성 명령 전달 모듈(125), 이동 통신 모듈(126), 마이크로폰(127), 음성 인식 모듈(128), 호출어 입력/저장 제어 모듈(129)을 포함하도록 구성될 수 있다. 이하, 세부적인 구성에 대하여 설명한다.
블루투스 통신 모듈(121)은 음성 인식 액세서리(110)와 블루투스 통신을 수행하도록 구성될 수 있다.
블루투스 통신 모듈(121)은 음성 인식 액세서리(110)로부터 호출어를 수신하도록 구성될 수 있다.
호출어 인식 모듈(122)은 블루투스 통신 모듈(121)에서 수신된 호출어를 인식하도록 구성될 수 있다. 호출어 인식 모듈(122)은 호출어-어플리케이션 데이터베이스(123)에 미리 저장된 호출어-어플리케이션의 대응쌍을 참조하여 호출어가 어느 어플리케이션(10)을 호출하기 위한 호출어인지 인식하도록 구성될 수 있다.
호출어-어플리케이션 데이터베이스(123)에는 호출어-어플리케이션의 대응쌍이 미리 저장되도록 구성될 수 있다. 예를 들어, 애플사의 아이폰의 AI 서비스 어플리케이션은 '시리'라는 호출어와 대응되어 저장될 수 있다. 삼성의 갤럭시폰의 AI 서비스 어플리케이션은 '빅스비'라는 호출어와 대응되어 저장될 수 있다.
어플리케이션 실행 모듈(124)은 호출어 인식 모듈(122)에서 인식된 호출어에 대응되는 어플리케이션(10)을 웨이크-업(wake-up)하여 실행하도록 구성될 수 있다.
음성 명령 전달 모듈(125)은 어플리케이션 실행 모듈(124)에 의해 특정 어플리케이션(10)이 실행된 상태에서 해당 어플리케이션(10)의 기능 수행을 위한 사용자의 음성 명령을 해당 어플리케이션(10)에 전달하여 입력하도록 구성될 수 있다.
여기서, 사용자의 음성 명령은 블루투스 통신 모듈(121)을 통해 음성 인식 액세서리(110)로부터 수신될 수 있다.
어플리케이션(10)은 그 어플리케이션(10)의 서비스 제공 서버(130)로부터 필요한 서비스를 제공받을 필요가 있을 수 있다. 이러한 경우, 그 어플리케이션(10)은 서비스 제공 서버(130)와 통신하도록 구성될 수 있다.
어플리케이션(10)은 사용자의 음성 명령을 이동 통신 모듈(126)을 통해 서비스 제공 서버(130)로 송신하도록 구성될 수 있다. 예를 들어, 음성 명령이 특정 검색 명령인 경우 그 검색 명령을 서비스 제공 서버(130)로 송신할 수 있다.
마이크로폰(127)은 사용자의 음성을 입력받기 위한 구성이다. 여기서, 마이크로폰(127)은 사용자가 특정 어플리케이션(10)을 웨이크-업하기 위한 호출어를 직접 지정하고자 할 때 이용될 수 있다.
음성 인식 모듈(128)은 마이크로폰(127)에서 입력되는 음성을 인식하도록 구성될 수 있다. 여기서, 음성은 호출어가 될 수 있다.
호출어 입력/저장 제어 모듈(129)은 음성 인식 모듈(128)에서 인식된 호출어를 호출어-어플리케이션 데이터베이스(123)에 입력하여 갱신 저장하도록 구성될 수 있다.
사용자는 모바일 단말(120)에 설치된 어플리케이션(10)마다 호출어를 직접 입력하여 설정할 수 있으며, '시리'나 '빅스비'와 같은 기존의 호출어도 사용자가 변경하여 저장하도록 구성될 수 있다. 사용자만 알고 있어야 하는 특정 호출어를 새로 저장하거나 변경하여 저장할 수 있다.
한편, 어플리케이션 잠금 설정 모듈(미도시)은 사용자의 입력에 따라 특정 어플리케이션(10)을 잠금 설정하도록 구성될 수 있다. 잠금 설정이 된 어플리케이션(10)은 사용자가 호출한 경우에만 웨이크-업되어 실행되도록 구성될 수 있다. 즉, 잠금 설정된 어플리케이션(10)은 패턴 입력이나 비밀번호 입력, 지문 입력에 의해 잠금 해제되지 않고, 사용자의 음성 지문과 사용자가 직접 지정한 호출어에 의해서만 해당 어플리케이션(10)이 잠금 해제되어 실행되도록 구성될 수 있다.
이러한 경우, 해당 어플리케이션(10)은 사용자의 음성 지문은 물론 사용자의 호출어라는 이중의 보안 설정에 의해 안전하게 보호될 수 있다.
호출어 입력/저장 제어 모듈(129)은 호출어-어플리케이션 데이터베이스(123)에 저장된 호출어-어플리케이션 대응쌍에서 호출어를 블루투스 통신 모듈(121)을 통해 음성 인식 액세서리(110)로 송신하도록 구성될 수 있다. 음성 인식 액세서리(110)에서는 모바일 단말(120)에서 호출어를 수신하여 호출어 데이터베이스(115)에 갱신 저장하도록 구성될 수 있다.
서비스 제공 서버(130)는 모바일 단말(120)의 특정 어플리케이션(10)과 통신하도록 구성되며, 해당 어플리케이션(10)에서 요구하는 서비스를 제공하도록 구성될 수 있다.
도 2는 본 발명의 실시예에 따른 음성 인식 액세서리를 이용한 서비스 제공 방법의 흐름도이다.
도 2를 참조하면, 음성 인식 액세서리(voice recognition accessory)(110)가 사용자의 호출어를 인식한다(S101).
다음으로, 음성 인식 액세서리(110)가 인식된 호출어에 대응되는 웨이크-업 시그널(wake-up signal)을 생성한다(S102).
다음으로, 음성 인식 액세서리(110)가 생성된 웨이크-업 시그널을 모바일 단말(120)로 실시간 송신하고, 모바일 단말(120)이 음성 인식 액세서리(110)로부터 웨이크-업 시그널을 실시간 수신한다(S103).
이때, 음성 인식 액세서리(110)와 모바일 단말(120)은 블루투스(Bluetooth) 통신을 이용하여 웨이크-업 시그널을 송수신하도록 구성될 수 있다.
다음으로, 모바일 단말(120)이 실시간 수신된 웨이크-업 시그널을 인식하고, 인식된 웨이크-업 시그널에 따른 어플리케이션(10)을 동작시킨다(S104).
다음으로, 서비스 제공 서버(130)가 모바일 단말(120)에서 동작되는 어플리케이션(10)에 의한 서비스를 모바일 단말(120)로 제공한다(S105).
여기서, 어플리케이션(10) 및 서비스 제공 서버(130)는 해당 서비스 별로 각각 별도로 구비될 수 있다.
이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (6)

  1. 사용자의 호출어를 인식하고, 인식된 호출어에 대응되는 웨이크-업 시그널(wake-up signal)을 생성하여 실시간 송신하는 음성 인식 액세서리(voice recognition accessory);
    상기 음성 인식 액세서리로부터 웨이크-업 시그널을 실시간 수신하여 웨이크-업 시그널을 인식하고, 인식된 웨이크-업 시그널에 따른 어플리케이션이 구동되는 모바일 단말(mobile terminal);
    상기 모바일 단말에서 구동되는 어플리케이션과 통신하여 해당 서비스를 제공하는 서비스 제공 서버를 포함하는 음성 인식 액세서리를 이용한 서비스 제공 시스템.
  2. 제1항에 있어서, 상기 어플리케이션 및 서비스 제공 서버는,
    상기 해당 서비스 별로 각각 별도로 구비되는 것을 특징으로 하는 음성 인식 액세서리를 이용한 서비스 제공 시스템.
  3. 제1항에 있어서, 상기 음성 인식 액세서리는,
    블루투스(Bluetooth) 통신을 이용하여 웨이크-업 시그널을 상기 모바일 단말로 송신하도록 구성되는 것을 특징으로 하는 음성 인식 액세서리를 이용한 서비스 제공 시스템.
  4. 음성 인식 액세서리(voice recognition accessory)가 사용자의 호출어를 인식하는 단계;
    상기 음성 인식 액세서리가 상기 인식된 호출어에 대응되는 웨이크-업 시그널(wake-up signal)을 생성하는 단계;
    상기 음성 인식 액세서리가 상기 생성된 웨이크-업 시그널을 모바일 단말로 실시간 송신하고, 상기 모바일 단말이 상기 음성 인식 액세서리로부터 웨이크-업 시그널을 실시간 수신하는 단계;
    상기 모바일 단말이 실시간 수신된 웨이크-업 시그널을 인식하고, 인식된 웨이크-업 시그널에 따른 어플리케이션을 동작시키는 단계;
    서비스 제공 서버가 상기 모바일 단말에서 동작되는 어플리케이션에 의한 서비스를 상기 모바일 단말로 제공하는 단계를 포함하는 음성 인식 액세서리를 이용한 서비스 제공 방법.
  5. 제4항에 있어서, 상기 어플리케이션 및 서비스 제공 서버는,
    상기 해당 서비스 별로 각각 별도로 구비되는 것을 특징으로 하는 음성 인식 액세서리를 이용한 서비스 제공 방법.
  6. 제4항에 있어서, 상기 음성 인식 액세서리가 상기 생성된 웨이크-업 시그널을 모바일 단말로 실시간 송신하고, 상기 모바일 단말이 상기 음성 인식 액세서리로부터 웨이크-업 시그널을 실시간 수신하는 단계는,
    블루투스(Bluetooth) 통신을 이용하여 웨이크-업 시그널을 송수신하도록 구성되는 것을 특징으로 하는 음성 인식 액세서리를 이용한 서비스 제공 방법.
PCT/KR2019/013433 2019-06-11 2019-10-14 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법 WO2020251116A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/418,841 US20220059079A1 (en) 2019-06-11 2019-10-14 Service providing system and method using voice recognition accessory

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0068525 2019-06-11
KR1020190068525A KR20200141687A (ko) 2019-06-11 2019-06-11 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법

Publications (1)

Publication Number Publication Date
WO2020251116A1 true WO2020251116A1 (ko) 2020-12-17

Family

ID=73781805

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/013433 WO2020251116A1 (ko) 2019-06-11 2019-10-14 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법

Country Status (3)

Country Link
US (1) US20220059079A1 (ko)
KR (1) KR20200141687A (ko)
WO (1) WO2020251116A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102561458B1 (ko) * 2021-01-19 2023-07-28 주식회사 엘지유플러스 음성인식 기반 차량제어 방법 및 그 시스템

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160068090A (ko) * 2014-12-04 2016-06-15 재단법인 다차원 스마트 아이티 융합시스템 연구단 웨이크업 신호를 이용한 통신 시스템 및 상기 통신 시스템의 운용 방법
US20170279950A1 (en) * 2014-08-21 2017-09-28 Paumax Oy Communication device control with external accessory
KR20180118462A (ko) * 2017-04-21 2018-10-31 엘지전자 주식회사 음성 인식 장치, 및 음성 인식 시스템
KR20180121210A (ko) * 2017-04-28 2018-11-07 삼성전자주식회사 음성 인식 서비스를 제공하는 전자 장치 및 그 방법
KR20180138017A (ko) * 2017-06-20 2018-12-28 삼성전자주식회사 음성 인식을 위한 전자 장치 및 시스템
WO2019102066A1 (en) * 2017-11-23 2019-05-31 Mikko Vaananen Mobile secretary cloud application

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102092966B1 (ko) 2013-02-12 2020-03-25 주식회사 엘지유플러스 선호 기능의 연결 정보를 이용한 어플리케이션 호출 방법 및 단말기
KR101560448B1 (ko) 2013-07-24 2015-10-16 한국과학기술원 스크린 록 환경에서 특정 어플리케이션 호출을 위한 방법
US10685656B2 (en) * 2016-08-31 2020-06-16 Bose Corporation Accessing multiple virtual personal assistants (VPA) from a single device
CN113056923A (zh) * 2018-11-14 2021-06-29 (株) 奥菲欧 具有发言者语音还原功能的带麦耳机
CN110225184A (zh) * 2019-05-09 2019-09-10 张桂芳 一种智能家居用多功能音耳机

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170279950A1 (en) * 2014-08-21 2017-09-28 Paumax Oy Communication device control with external accessory
KR20160068090A (ko) * 2014-12-04 2016-06-15 재단법인 다차원 스마트 아이티 융합시스템 연구단 웨이크업 신호를 이용한 통신 시스템 및 상기 통신 시스템의 운용 방법
KR20180118462A (ko) * 2017-04-21 2018-10-31 엘지전자 주식회사 음성 인식 장치, 및 음성 인식 시스템
KR20180121210A (ko) * 2017-04-28 2018-11-07 삼성전자주식회사 음성 인식 서비스를 제공하는 전자 장치 및 그 방법
KR20180138017A (ko) * 2017-06-20 2018-12-28 삼성전자주식회사 음성 인식을 위한 전자 장치 및 시스템
WO2019102066A1 (en) * 2017-11-23 2019-05-31 Mikko Vaananen Mobile secretary cloud application

Also Published As

Publication number Publication date
US20220059079A1 (en) 2022-02-24
KR20200141687A (ko) 2020-12-21

Similar Documents

Publication Publication Date Title
US7030752B2 (en) Universal gateway module for interfacing a security system control to external peripheral devices
EP3580750A1 (en) Method and apparatus for managing voice-based interaction in internet of things network system
EP3707628A1 (en) Electronic device for authenticating user by using audio signal and method thereof
KR101361334B1 (ko) 휴대 폰과 스피치 가능 소프트 폰의 통합 방법
CN108877805A (zh) 语音处理模组和具有语音功能的终端
WO2015043173A1 (zh) 一种在通话过程中发送联系人信息的方法及系统
US6529585B2 (en) Voice label processing apparatus and method
WO2020251116A1 (ko) 음성 인식 액세서리를 이용한 서비스 제공 시스템 및 방법
WO2019190096A1 (ko) 사용자 음성 입력을 처리하는 장치
WO2015041434A1 (ko) 다국어 메시지 번역 시스템 및 그 방법
CN109151637A (zh) 无线耳机、用于无线耳机的智能语音控制系统及方法
WO2019059493A1 (ko) 챗봇을 이용한 사용자 케어 시스템
WO2018117660A1 (en) Security enhanced speech recognition method and device
WO2022019674A1 (ko) 음성 단말기의 음성 검증 및 제한 방법
KR0149155B1 (ko) 개인용 컴퓨터에서의 일반 전화 시스템 및 통화 방법
WO2020138943A1 (ko) 음성을 인식하는 장치 및 방법
WO2021020624A1 (ko) 음성인식 서비스 선별 조정장치
WO2018038349A1 (ko) 사용자 컨텍스트에 따르는 네트워크 연결 제어방법 및 그에 따른 사용자 단말기
WO2024085379A1 (en) A method and a system for simultaneously facilitating telephone calls in an electronic device
WO2024063420A1 (ko) 통신 장치 및 그의 통신 방법
WO2017074091A1 (ko) 음성키워드 기반의 다기능 서비스 시스템
WO2023121231A1 (en) Computer implemented method for determining false positives in a wakeup-enabled device, corresponding device and system
WO2023182766A1 (ko) 음성 인식 트리거를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
US20230254411A1 (en) Group calling system, group calling method, and program
JPH0548702A (ja) 音声着呼機能付音声ダイヤル装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19932790

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19932790

Country of ref document: EP

Kind code of ref document: A1