KR102096156B1 - 웨이크업 방법, 디바이스 및 가독매체 - Google Patents
웨이크업 방법, 디바이스 및 가독매체 Download PDFInfo
- Publication number
- KR102096156B1 KR102096156B1 KR1020180030250A KR20180030250A KR102096156B1 KR 102096156 B1 KR102096156 B1 KR 102096156B1 KR 1020180030250 A KR1020180030250 A KR 1020180030250A KR 20180030250 A KR20180030250 A KR 20180030250A KR 102096156 B1 KR102096156 B1 KR 102096156B1
- Authority
- KR
- South Korea
- Prior art keywords
- request
- intelligent device
- wake
- cloud server
- user
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 157
- 238000012545 processing Methods 0.000 claims description 83
- 238000004458 analytical method Methods 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 23
- 238000001514 detection method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 5
- 239000003550 marker Substances 0.000 claims description 5
- 230000002618 waking effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3231—Monitoring the presence, absence or movement of users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L15/222—Barge in, i.e. overridable guidance for interrupting prompts
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
본 발명은 음성웨이크업 방법, 디바이스 및 시스템, 클라우드 서버와 가독매체를 제공한다. 상기 방법은 지능 디바이스가 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제1요구를 수신하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 것을 포함한다. 본 발명의 기술방안은 지능 디바이스가 음성식별 단계에 진입한 후, 수신한 제1요구가 웨이크업 단어인 경우 해당 제1요구에 대하여 서비스 만족처리를 하지 않고, 해당 제1요구가 다시 웨이크업임을 식별할 수 있고, 명령 식별 에러를 일으키지 않고, 사용자의 기대를 만족시킬 수 있다. 본 발명의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
Description
본 발명은 컴퓨터 응용 기술분야에 관한 것으로서, 특히 웨이크업 방법, 지능 디바이스, 서버, 디바이스 및 가독매체에 관한 것이다.
과학기술의 발전에 따라 사용자가 지능 디바이스를 보다 편리하게 이용하게 하기 위하여 종래의 많은 지능 디바이스는 사용자의 음성입력을 서포트하고 있다.
지능 디바이스는 장기간 온라인 상태에 있으면 지능 디바이스의 소비 전력이 커지고, 수명이 짧아진다. 때문에 종래의 지능 디바이스는 동작하지 않을 때는 휴면상태로 되어 소비 전력을 절약한다. 사용자가 지능 디바이스를 이용 할 필요가 있을 때 웨이크업 단어로 지능 디바이스를 웨이크업할 수 있다. 그 후, 지능 디바이스는 음성식별 상태에 진입한다. 이 상태에서 지능 디바이스는 사용자가 입력한 음성형식의 요구를 수신하고, 클라우드 서버에 협력하여 사용자의 음성을 식별하고, 어의를 분석하고, 사용자가 요구한 서비스를 만족시킨다. 종래의 기술에서 사용자가 지능 디바이스를 웨이크업할 때 웨이크업 단어를 적어도 2번 음성입력하면 첫번째 웨이크업 단어는 지능 디바이스를 웨이크업하는데 이용함으로 식별되고, 그 후의 웨이크업 단어는 음성요구의 입력으로 식별되며, 그 때 지능 디바이스는 클라우드 서버에 협력하여 해당 웨이크업 단어에 근거하여 사용자가 요구하는 서비스를 조회한다.
따라서 종래의 웨이크업 방안에 의하면 웨이크업할 때 웨이크업 단어를 적어도 2번 입력하면 두번째 웨이크업 단어는 사용자의 음성요구로 오인되어 명령 식별 에러를 일으키고, 사용자의 기대를 만족시킬 수 없다.
본 발명은 명령 식별의 정확성을 향상시키고 사용자의 기대를 만족시키는 웨이크업 방법, 지능 디바이스, 서버, 디바이스 및 가독매체를 제공한다.
본 발명은
지능 디바이스가 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제1요구를 수신하고;
어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고;
일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는 것임을 확정하는 것을 포함하는 음성웨이크업 방법을 제공한다.
또한 바람직하게는 상기 방법에서 지능 디바이스가 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제1요구를 수신하기 전에 상기 방법은,
상기 사용자가 음성방식으로 입력한 제2요구를 수신하고;
상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하고, 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 더 포함하고;
또한 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한 후 상기 방법은,
상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 더 포함한다.
또한 바람직하게는 상기 방법에서 지능 디바이스가 음성식별 단계에 진입하는 경우, 사용자가 음성방식으로 입력한 제1요구를 수신하기 전에 상기 방법은,
상기 사용자가 음성방식으로 입력한 제2요구를 수신하고;
클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하는 것을 포함하고,
또한 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한 후 상기 방법은,
상기 클라우드 서버에 상기 지능 디바이스 표식이 첨부된 다시 웨이크업 통지 메시지를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 대응하는 상기 지능 디바이스를 확정하여 다시 웨이크업하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지하거나, 또는
상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제1요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하게 하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지시키는 것을 포함한다.
또한 바람직하게는 상기 방법에서 상기 사용자가 음성방식으로 입력한 제2요구를 수신한 후, 클라우드 서버에 상기 지능 디바이스 표식을 가지고 있는 상기 제2요구를 발송하기 전에 상기 방법은,
상기 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못한 것을 더 포함한다.
또한 바람직하게는 상기 방법에서클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송한 후, 상기 방법은,
현재 시각과 상기 클라우드 서버에 상기 제2요구를 발송하는 시각의 시간차를 획득하고;
상기 클라우드 서버가 발송한 상기 제2요구의 서비스 피드백을 수신할 때까지 상기 사용자에게 상기 시간차를 표시하고, 서비스 피드백을 수신하면 상기 시간차의 표시를 취소하고;
상기 사용자가 표시된 상기 시간차에 근거하여 상기 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 더 포함하거나,
또는, 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송한 후, 상기 방법은,
상기 제2요구를 발송한 후의 미리 설정 시간내에 상기 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고;
수신하지 않았으면 상기 사용자에게 다시 웨이크업의 제시 메시지를 표시하고;
상기 사용자가 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 더 포함한다.
본 발명은 지능 디바이스가 음성식별 단계에 진입한 후, 상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 상기 지능 디바이스가 수신한 사용자가 입력한 제1요구를 수신하고;
상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고;
어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하고;
일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 것을 포함하는 음성웨이크업 방법을 제공한다.
또한 바람직하게는 상기 방법에서 상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 제1요구를 수신하기 전에 상기 방법은,
상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 상기 지능 디바이스가 수신한 사용자가 입력한 제2요구를 수신하고;
상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 더 포함하고,
수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한 후 상기 방법은,
상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 더 포함한다.
본 발명은 상기 지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제1요구를 수신하는 수신모듈과,
어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하는 판단모듈과,
상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 확정모듈을 포함하는 지능 디바이스를 제공한다.
또한 바람직하게는 상기 지능 디바이스에서 상기 지능 디바이스는 서비스 만족처리모듈을 더 포함하고,
상기 수신모듈은 상기 사용자가 음성방식으로 입력한 제2요구를 더 수신하고,
서비스 만족처리모듈은 상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하고, 상기 제2요구에 대응하는 서비스 만족처리를 시작하고,
또한 상기 서비스 만족처리모듈은 상기 제2요구에 대응하는 서비스 만족처리를 정지한다.
또한 바람직하게는 상기 지능 디바이스에서 상기 지능 디바이스는 발송모듈을 더 포함하고,
상기 수신모듈은 상기 사용자가 음성방식으로 입력한 제2요구를 더 수신하고,
상기 발송모듈은 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하고,
또한 상기 발송모듈은 상기 클라우드 서버에 상기 지능 디바이스 표식이 첨부된 다시 웨이크업 통지 메시지를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 대응하는 상기 지능 디바이스를 확정하여 다시 웨이크업하고 상기 제2요구에 대응하는 서비스 만족처리를 정지하고,
또는, 상기 발송모듈은 상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제1요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하게 하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지한다.
또한 바람직하게는 상기 지능 디바이스에서 상기 서비스 만족처리모듈은 상기 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못한다.
또한 바람직하게는 상기 지능 디바이스는 획득모듈과 표시모듈을 더 포함하고,
상기 획득모듈은 현재 시각과 상기 클라우드 서버에 상기 제2요구를 발송하는 시각의 시간차를 획득하고,
상기 표시모듈은 상기 클라우드 서버가 발송한 상기 제2요구의 서비스 피드백을 수신할 때까지 상기 사용자에게 상기 시간차를 표시하고, 서비스 피드백을 수신하면 상기 시간차의 표시를 취소하고,
상기 수신모듈은 상기 사용자가 표시된 상기 시간차에 근거하여 상기 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 상기 웨이크업 단어를 더 수신하고, 상기 지능 디바이스를 다시 웨이크업하고,
또는, 상기 지능 디바이스는 검출모듈을 더 포함하고,
상기 검출모듈은 상기 제2요구를 발송한 후의 미리 설정 시간내에 상기 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고,
상기 표시모듈은 상기 검출모듈이 상기 제2요구후의 미리 설정한 시간길이내에 상기 클라우드 서버의 서비스 피드백을 수신하지 못한 것을 검출하면, 상기 사용자에게 다시 웨이크업의 제시 메시지를 더 표시하고,
상기 수신모듈은 상기 사용자가 음성입력한 상기 웨이크업 단어를 더 수신하고, 상기 지능 디바이스를 다시 웨이크업한다.
본 발명은,
지능 디바이스가 음성식별 단계에 진입한 후, 상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 상기 지능 디바이스가 수신한 사용자가 입력한 제1요구를 수신하는 수신모듈과,
상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하는 획득모듈과,
어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하는 판단모듈과,
상기 판단모듈이 어의해석 후의 상기 제1요구와 사전에 저장한 상기 웨이크업 단어가 일치함을 판단하면, 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 확정모듈을 포함하는 클라우드 서버를 더 제공한다.
또한 바람직하게는 상기 클라우드 서버에서,서비스 만족처리모듈을 더 포함하고,
상기 수신모듈은 상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 상기 지능 디바이스가 수신한 사용자가 입력한 제2요구를 더 수신하고,
상기 서비스 만족처리모듈은 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하고,
상기 서비스 만족처리모듈은 상기 제2요구에 대응하는 서비스 만족처리를 더 정지한다.
본 발명은 지능 디바이스와 상기 클라우드 서버를 더 포함하고, 상기 지능 디바이스는 상기 클라우드 서버와 통신연결하고, 상기 지능 디바이스는 상기 지능 디바이스를 이용하고, 상기 클라우드 서버는 상기 클라우드 서버를 이용하는 음성웨이크업 시스템을 제공한다.
본 발명은,
하나 또는 복수의 프로세서와,
하나 또는 복수의 프로그램을 저장한 메모리를 포함하는 지능 디바이스로서,
상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행되면 상기 하나 또는 복수의 프로세서가 상기 방법을 구현하는 지능 디바이스를 더 제공한다.
본 발명은,
하나 또는 복수의 프로세서와,
하나 또는 복수의 프로그램을 저장한 메모리를 포함하는 클라우드 서버로서,
상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행되면 상기 하나 또는 복수의 프로세서가 상기 방법을 구현하는 클라우드 서버를 제공한다.
본 발명은 컴퓨터 프로그램을 기억하는 컴퓨터 가독매체로서 상기 프로그램이 프로세서에 의해 실행되면 상기 방법을 구현하는 컴퓨터 가독매체를 더 제공한다.
본 발명의 음성웨이크업 방법, 지능 디바이스, 서버, 디바이스 및 가독매체는, 상기 기술방안을 이용하여 지능 디바이스가 음성식별 단계에 진입한 후, 수신한 사용자의 제1요구가 웨이크업 단어이면 해당 제1요구에 대하여 서비스 만족처리를 하지 않고, 해당 제1요구가 다시 웨이크업임을 식별할 수 있고, 명령 식별 에러를 일으키지 않고, 사용자의 기대를 만족시킬 수 있다. 본 발명의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상 시킬 수 있다.
도1은 본 발명의 음성웨이크업 방법의 실시예 1의 흐름도이다.
도2는 본 발명의 음성웨이크업 방법의 실시예 2의 흐름도이다.
도3은 본 발명의 음성웨이크업 방법의 실시예 3의 신호도이다.
도4은 본 발명의 음성웨이크업 방법의 실시예 4의 신호도이다.
도5는 본 발명의 지능 디바이스 실시예 1의 구조도이다.
도6은 본 발명의 지능 디바이스 실시예 2의 구조도이다.
도7은 본 발명의 클라우드 서버의 실시예 1의 구조도이다.
도8은 본 발명의 클라우드 서버의 실시예 2의 구조도이다.
도9은 본 발명의 음성웨이크업 시스템의 실시예의 구조도이다.
도10은 본 발명의 지능 디바이스 실시예의 구조도이다.
도11은 본 발명이 제공하는 클라우드 서버의 예시도이다.
도2는 본 발명의 음성웨이크업 방법의 실시예 2의 흐름도이다.
도3은 본 발명의 음성웨이크업 방법의 실시예 3의 신호도이다.
도4은 본 발명의 음성웨이크업 방법의 실시예 4의 신호도이다.
도5는 본 발명의 지능 디바이스 실시예 1의 구조도이다.
도6은 본 발명의 지능 디바이스 실시예 2의 구조도이다.
도7은 본 발명의 클라우드 서버의 실시예 1의 구조도이다.
도8은 본 발명의 클라우드 서버의 실시예 2의 구조도이다.
도9은 본 발명의 음성웨이크업 시스템의 실시예의 구조도이다.
도10은 본 발명의 지능 디바이스 실시예의 구조도이다.
도11은 본 발명이 제공하는 클라우드 서버의 예시도이다.
본 발명의 실시예의 목적, 기술방안 및 우점을 보다 명확히 하기 위하여 아래에서는 도면 및 실시예를 결합하여 본 발명을 상세히 기술한다.
도1은 본 발명의 음성웨이크업 방법의 실시예 1의 흐름도이다. 도1에 나타내는 바와 같이 본 실시예의 음성웨이크업 방법은 구체적으로 이하의 절차를 포함한다.
100, 지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제1요구를 수신한다.
본 실시예의 음성웨이크업 방법의 실행 주체는 지능 디바이스로서, 예를 들면, 본 실시예의 지능 디바이스는 휴대전화, 태블릿 컴퓨터 또는, 다른 Android조작 시스템(Operating System;OS), IOS의 OS, 또는 Linux매입형OS를 인스톨한 하드웨어 디바이스일 수 있다.
본 실시예의 지능 디바이스는 이용 시 음성입력을 서포트하며, 소비 전력을 감소하기 위하여 본 실시예의 지능 디바이스는 장기간 이용하지 않을 경우 대기 상태에 있는다. 사용자는 지능 디바이스에 웨이크업 단어를 입력하여 지능 디바이스를 웨이크업할 수 있다. 그 후 지능 디바이스는 음성식별 단계에 진입한다.
예를 들면, 미리 설정 시간한계값을 설치하고, 지능 디바이스가 미리 설정 시간한계값의 시간길이내에 임의의 음성입력을 수신하지 않았으면, 그 때 지능 디바이스는 대기 단계에 진입한다. 구체적으로, 미리 설정 시간한계값은 지능 디바이스에 저장할 수도 있고, 지능 디바이스 자체로 미리 설정 시간한계값의 시간길이내에 사용자의 임의의 음성입력을 수신하지 않았는지를 검출하고, 수신하지 않았으면 대기 단계에 진입한다.
또는 지능 디바이스와 원격무선통신하는 클라우드 서버가 해당 미리 설정 시간한계값을 저장할 수도 있다. 지능 디바이스가 동작할 때, 사용자의 음성요구만을 수신하고, 그 후 사용자의 음성요구를 클라우드 서버에 발송하고, 클라우드 서버에 의해 처리한다. 지능 디바이스에 고장이 없고 네트워크가 정상일 때, 클라우드 서버가 미리 설정 시간한계값의 시간길이내에 지능 디바이스가 발송한 임의의 음성입력을 수신하지 않았으면 사용자가 미리 설정 시간한계값의 시간길이내에 지능 디바이스에 임의의 음성입력도 발송하지 않은 것을 확정할 수 있다. 이 때, 클라우드 서버는 지능 디바이스에 휴면에 진입하는 지시 메시지를 발송하고, 지능 디바이스는 수신한 지시 메시지에 근거하여 소비 전력을 저감하고, 휴면 단계에 진입할 수 있다.
지능 디바이스가 음성식별 단계에 진입한 후, 지능 디바이스는 사용자의 음성요구를 수신한 후, 단독으로 사용자의 음성요구를 처리할 수도 있고, 클라우드 서버에 협력하여 사용자의 음성요구를 처리할 수도 있고, 처리 과정은 음성식별, 어의해석 및 서비스 만족을 포함할 수 있다. 다시 말하면 먼저 사용자가 입력한 음성을 식별하고, 문자정보로 식별한 후, 식별한 문자정보를 어의해석하고, 사용자의 의도 즉 지사용자의 요구를 분석하고, 마지막으로 사용자의 요구에 대응하는 서비스를 확정하고, 사용자의 서비스를 만족시킨다. 지능 디바이스는 완전히 해제하여 상기 방식과 같이 사용자의 음성요구를 수신한 후, 직접 클라우드 서버에 발송하고, 클라우드 서버에 의해 음성식별, 어의해석 및 서비스 만족 처리를 할 수도 있다. 또는 지능 디바이스가 소정의 처리 기능을 소유하고, 소정의 서비스 정보 베이스를 저장하고 있을 수도 있으며, 음성식별, 어의해석 및 서비스 만족은 전부 지능 디바이스에서 진행할 수도 있다. 이렇게 되면, 지능 디바이스에 대한 요구가 높아지므로, 지능 디바이스만에 의해 어의식별과 어의해석을 한 후, 클라우드 서버에 의해 서비스 만족처리를 할 수 있다. 본 실시예의 서비스 만족처리는 즉 사용자에게 해당 요구를 만족시키는 서비스를 제공하는 처리 과정이다. 예를 들면, 요구는 "카메라를 기동한다"이며, "오늘의 금값", "오늘의 환율"을 조회한다.
본 실시예에서 지능 디바이스가 음성식별과 어의해석을 할 수 있는 것을 예로 한다. 또한 서비스 만족은 지능 디바이스측에서 진행할 수도 있고, 클라우드 서버측에서 진행할 수도 있다. 지능 디바이스는 웨이크업 단어를 더 수신하고 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제1요구를 수신한다. 그 후, 지능 디바이스는 해당 제1요구에 대하여 음성식별과 어의해석을 하고, 해석하고 나서 해당 제1요구에 대응하는 문자형식을 더 획득한다. 예를 들면, 사용자가 입력한 음성형식의 제1요구는 해당 지능 디바이스의 웨이크업 단어일 수도 있으며 이때 대응하는 음성식별, 어의해석 후의 제1요구는 문자형식의 웨이크업 단어일 수 있다.
101, 어의해석 후의 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 절차 102를 실행하고, 그렇지 않으면 제1요구에 대하여 서비스 만족처리한다.
102, 수신한 상기 제1요구가 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한다.
본 실시예에서 어의해석 후의 제1요구를 사전에 저장한 웨이크업 단어와 비교하고, 어의해석 후의 제1요구가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단하고, 일치하면 해당 제1요구가 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한다. 그렇지 않으면, 제1요구에 대하여 서비스 만족처리를 진행한다.
바람직하게는, 실제의 응용에서는 지능 디바이스가 수신한 모두의 제1요구를 각각 사전에 저장한 웨이크업 단어와 비교하는데 이는 처리 효율의 저하를 일으킨다. 때문에 먼저 어의해석 후의 제1요구의 문자수를 획득하고, 그 문자수가 사전에 저장한 웨이크업 단어의 문자수와 동일하면 어의해석 후의 제1요구를 사전에 저장한 웨이크업 단어와 비교하여 양자가 일치한지 여부를 판단하고, 처리 요율을 향상시킬 수 있다.
본 실시예의 음성웨이크업 방법은 지능 디바이스가 음성식별 단계에 진입하는 경우, 사용자가 음성방식으로 입력한 제1요구를 수신하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한다. 본 실시예의 기술방안은 지능 디바이스가 음성식별 단계에 진입한 후, 수신한 제1요구가 웨이크업 단어이면 해당 제1요구에 대하여 서비스 만족처리를 하지 않고, 해당 제1요구가 다시 웨이크업임을 식별할 수 있고, 명령 식별 에러를 일으키지 않고, 사용자의 기대를 만족시킬 수 있다. 본 실시예의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
바람직하게는, 상기 도1에 표시한 실시예의 절차 100의 "지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제1요구를 수신한다" 전에, 사용자가 음성방식으로 입력한 제2요구를 더 수신하고, 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 제2요구에 대응하는 서비스를 조회하고, 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 포함한다.
지능 디바이스가 음성식별 단계에 진입한 후, 지능 디바이스는 사용자의 음성요구를 처리할 수 있다. 예를 들면, 지능 디바이스는 사용자가 음성방식으로 입력한 제2요구를 수신할 수 있다. 그 후 해당 제2요구에 대하여 음성식별, 어의해석을 진행하여 제2요구의 문자수가 웨이크업 단어의 문자수와 일치하지 않음을 확정한다. 그 후 제2요구에 대하여 서비스 만족처리를 시작한다. 구체적으로 지능 디바이스의 로컬 서비스 정보 베이스에서 해당 제2요구에 대응하는 서비스를 조회하고, 사용자에게 해당 서비스를 제공한다. 예를 들면, 사용자는 음성으로 "XXX에 전화를 걸어 주세요"를 입력하면, 이 때 지능 디바이스는 해당 요구에 대하여 음성식별과 어의해석을 한 후, 서비스 정보 베이스에서 해당 "XXX에 전화를 걸어 주세요"에 대응하는 서비스의 기동 방식을 조회하고, 그 후 사용자를 위하여 해당 서비스를 기동한다. 즉 연락처 목록에서 직접 XXX의 전화를 조회하고 전화를 건다. 지능 디바이스측의 서비스 정보 베이스에는 서비스의 명칭 예를 들면 "전화를 걸다", 서비스의 구현 형태 등의 지능 디바이스측에서 구현하는 모든 서비스 정보를 포함할 수 있다.
이 때 상응하게 절차 102에서 "수신한 제1요구가 지능 디바이스를 다시 웨이크업하는데 이용되는 것임을 확정한다" 후, 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 더 포함한다.
즉 사용자가 제2요구를 제출한 후, 지능 디바이스에 웨이크업 단어를 발송하면, 이 때 지능 디바이스는 사용자가 해당 지능 디바이스를 다시 웨이크업하는 것을 수요하는 것을 확정하고, 그 전에 구현하지 않은 서비스 만족처리는 전부 정지하고, 예를 들면, 아직 해당 제2요구의 서비스 구현 형태을 조회하고 있으면, 그 때 제2요구에 대응하는 서비스의 구현 형태을 조회하는 것을 정지하고, 현재 제2요구에 대응하는 서비스를 제공하고 있으면, 사용자에게 제2요구에 대응하는 서비스를 제공하는 것을 바로 정지한다.
바람직하게는, 본 실시예에서 지능 디바이스가 제1요구와 제2요구에 대하여 음성식별 및 어의해석을 하지 않고, 직접 클라우드 서버에 제1요구와 제2요구를 발송할 경우, 음성활성검출(Voice activity detection;VAD)을 고려하여 제1요구는 제2요구를 발송한 후 소정의 시간한계값의 뒤에 발송해야 하여 클라우드 서버가 해당 제2요구를 수신하는 것을 확보하고, 그 때 제1요구를 발송할 수 있다. 소정의 시간한계값은 실제 경험에 근거하여 선택할 수 있다.
상기 실시예에서 지능 디바이스가 음성식별, 어의분석 및 서비스 만족을 처리하는 것을 예로 하여 바람직하게는, 클라우드 서버에 의해 서비스 만족처리를 할 수도 있고, 구체적으로, 절차 100에서 "지능 디바이스가 음성식별 단계에 진입하는 경우, 사용자가 음성방식으로 입력한 제1요구를 수신한다" 전에, 사용자가 음성방식으로 입력한 제2요구를 수신하고, 클라우드 서버에 지능 디바이스 표식과 제2요구를 발송하고, 클라우드 서버에 지능 디바이스로 제2요구에 대응하는 서비스 만족처리의 실시를 개시시키는 것을 더 포함할 수도 있다.
같은 이유에 의해 지능 디바이스는 제2요구를 직접 클라우드 서버에 발송할 수도 있고, 제2요구를 음성식별 및 어의해석하고 나서 제2요구의 어의해석 후의 문자정보를 클라우드 서버에 발송할 수도 있다. 즉 본 실시예에 있어서의 서비스 만족은 클라우드 서버측에서 구현하고, 음성식별 및 어의분석은 지능 디바이스측에서 구현할 수도 있고, 물론, 실제 응용에서 음성식별 및 어의분석은 클라우드 서버측에서 구현할 수도 있다.
또한 절차 102의 "수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다"의 뒤에, 클라우드 서버에 지능 디바이스 표식을 가지고 있는 다시 웨이크업 통지 메시지를 발송하여 클라우드 서버가 지능 디바이스 표식에 근거하여 대응하는 지능 디바이스의 다시 웨이크업을 확정하도록 하고, 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 더 포함할 수도 있다.
이러한 방식에서 지능 디바이스가 음성식별 및 어의해석을 하고, 클라우드 서버가 서비스 만족처리를 구현한다. 지능 디바이스는 제1요구를 수신한 후 초보적 판단을 하여 사용자가 지능 디바이스를 다시 웨이크업하는 것을 필요로 하고 있는 것을 확정하고, 이 때 지능 디바이스는 직접 클라우드 서버에 지능 디바이스 표식을 가지고 있는 다시 웨이크업 통지 메시지를 발송한다. 따라서 클라우드 서버는 수신한 지능 디바이스 표식에 근거하여 대응하는 지능 디바이스의 다시 웨이크업을 확정하고, 제2요구에 대응하는 서비스 만족처리를 정지한다. 예를 들면, 제2요구에 대응하는 서비스의 조회를 정지하거나 또는, 지능 디바이스로 사용자에게 제2요구에 대응하는 서비스를 제공하는 것을 정지한다.
또는, 절차 102의 "수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다"의 뒤에, 클라우드 서버에 지능 디바이스 표식과 제1요구를 발송하고, 클라우드 서버에 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득시켜, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스의 다시 웨이크업에 이용되는 것임을 확정하고, 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 포함한다. 예를 들면, 제2요구에 대응하는 서비스를 정지하는 것을 포함할 수도 있고, 또는, 지능 디바이스로 사용자에게 제2요구에 대응하는 서비스를 제공하는 것을 정지하는 것을 더 포함한다.
이러한 방식과 위의 방식의 구별 점은 지능 디바이스는 자체 검출한 결과를 클라우드 서버에 발송하지 않고, 직접 클라우드 서버에 지능 디바이스 표식과 제1요구를 발송하고, 클라우드 서버에 의해 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스의 다시 웨이크업에 이용되는 것임을 확정하고, 제2요구에 대응하는 서비스 만족처리를 정지하는 것이다.
바람직하게는, 실제 응용에서 지능 디바이스와 클라우드 서버는 모두 서비스 만족을 구현할 수 있고, 지능 디바이스는 어떤 간단하고 로컬에서 구현할 수 있는 오프라인의 서비스 만족을 구현할 수 있고, 클라우드 서버는 어떤 복잡하고, 네트워크에 의해야만 구현할 수 있는 온라인 서비스 만족을 구현하는데 이용할 수 있다. 이 때 바람직하게는, 상기 실시예에서의 절차 "사용자가 음성방식으로 입력한 제2요구를 수신한다" 후, 절차 "클라우드 서버에 지능 디바이스 표식과 제2요구를 발송한다" 전에, 지능 디바이스의 로컬 서비스 정보 베이스에서 제2요구에 대응하는 서비스를 조회하지 못한 절차를 더 포함할 수도 있다. 지능 디바이스의 로컬 서비스 정보 베이스로에는 단지 로컬에서 구현할 수 있는 서비스의 명칭, 예를 들면, 사용자가 오늘 주가지수를 조회하려고 하면, 지능 디바이스의 로컬에서는 구현할 수 없으므로 이 때 "오늘 주가"의 서비스 명칭은 로컬의 서비스 정보 베이스에 저장되어 있지 않다. 그 때, 지능 디바이스의 로컬에서 해당 제2요구에 대응하는 서비스의 만족을 구현할 수 없는 경우, 클라우드 서버에 해당 제2요구를 발송하여 클라우드 서버가 해당 제2요구에 대응하는 서비스의 만족을 구현하게끔 한다. 예를 들면, 지능 디바이스의 로컬에서 어떤 오프라인의 서비스, 예를 들면 전화 걸기, 어떤 앱 열기 등을 구현할 수도 있다. 클라우드 서버에서 어떤 온라인 서비스, 예를 들면 오늘 주식시장의 주가 경향, 오늘 일기, 오늘 환율 등을 구현한다.
또한 바람직하게는, 상기 실시예의 기술방안의 기초상에서 "클라우드 서버에 지능 디바이스 표식과 제2요구를 발송한다" 후, 현재 시각과 클라우드 서버에 제2요구를 발송하는 시각의 시간차를 획득하고, 클라우드 서버가 발송한 제2요구의 서비스 피드백을 수신할 때까지 사용자에게 시간차를 표시하고, 클라우드 서버가 발송한 제2요구의 서비스 피드백을 수신하고 나서 시간차의 표시를 취소하고, 사용자가 음성입력한 사용자가 표시한 시간차에 의해 시간차가 미리 설정한 시간길이보다 긴 것을 확정했을 때에 발송한 웨이크업 단어를 수신하고, 지능 디바이스를 다시 웨이크업한다.
이러한 실시 형태에서 사용자에 의해 지능 디바이스를 다시 웨이크업하는 것을 확정하고, 그 전의 요구를 취소한다. 구체적으로, 지능 디바이스가 클라우드 서버에 요구를 발송한 때마다 1개의 타임 리코더를 기동하여 현재 시각과 클라우드 서버에 제2요구를 발송한 시각의 시간차를 카운트한다. 동시에 지능 디바이스의 디스플레이에서 사용자에게 그 시간차를 표시한다. 이렇게 하여, 사용자는 이 요구를 발송한 후 어느 정도의 시간이 지났는지를 요해할 수 있고, 지능 디바이스가 클라우드 서버가 피드백하는 이 요구에 대응하는 서비스를 수신하면, 그 때 지능 디바이스의 디스플레이상의 타임 리코더의 표시를 취소할 수 있다. 타임 리코더에 나타낸 시간차가 미리 설정한 시간길이, 예를 들면 60s보다 길고, 클라우드 서버의 임의의 서비스 피드백을 수신하지 않은 경우, 지능 디바이스의 디스플레이에 아직 점점 증가되는 시간차를 표시하면 이 때 사용자는 그 전의 요구를 취소하고, 지능 디바이스를 다시 웨이크업할 수 있다. 구체적으로, 사용자가 지능 디바이스에 웨이크업 단어를 음성입력하고, 독립적으로 조작하거나 또는 클라우드 서버에 협력하여 해당 지능 디바이스를 다시 웨이크업하는 것을 구현하고, 다시 웨이크업하기 전에 요구한 서비스 만족처리를 취소한다.
또는, 상기 실시예의 기술방안의 기초상에서 "클라우드 서버에 지능 디바이스 표식과 제2요구를 발송"한 후, 제2요구를 발송한 후의 미리 설정한 시간길이내에 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고, 수신하지 않았으면 사용자에게 다시 웨이크업의 제시 메시지를 표시하고, 사용자가 음성입력한 상기 웨이크업 단어를 수신하고, 지능 디바이스를 다시 웨이크업하는 절차를 더 포함한다.
이러한 구현 형태와 상기 구현 형태의 구별 점은 상기 구현 형태는 사용자에 의해 지능 디바이스의 다시 웨이크업을 촉발하는 것이다. 본 구현 형태에서는 지능 디바이스가 검출하고, 제2요구를 발송한 후의 미리 설정한 시간길이내에 클라우드 서버의 서비스 피드백을 수신하지 않았으면 지능 디바이스가 사용자에게 지능 디바이스를 다시 웨이크업하는 것을 제시한다. 그 후, 사용자가 웨이크업 단어를 음성입력하고, 지능 디바이스를 다시 웨이크업한다.
상기 실시예의 음성웨이크업 방법은 필요할 때 지능 단말기에 웨이크업 단어를 입력하여 다시 웨이크업하고, 음성식별로 오인하지 않으므로 명령 식별의 정확성을 보증할 수 있고, 사용자의 기대를 만족시킬 수 있다. 따라서 상기 실시예의 웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
도2는 본 발명의 음성웨이크업 방법의 실시예 2의 흐름도이다. 도2에 나타내는 바와 같이 본 실시예의 음성웨이크업 방법은 구체적으로 이하의 절차를 포함한다.
200, 지능 디바이스가 음성식별 단계에 진입한 후, 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신한 사용자가 입력한 제1요구를 수신한다.
201, 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득한다.
202, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 절차 203을 실행하고, 그렇지 않으면 제1요구에 대하여 서비스 만족처리한다.
203, 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다.
본 실시예의 음성웨이크업 방법의 실행 주체는 클라우드 서버이다. 본 실시예에서 클라우드 서버는 적어도 음성식별 단계의 서비스 만족의 구현을 제공한다. 음성식별과 어의해석은 지능 디바이스측에서 구현할 수도 있고, 클라우드 서버측에서 구현할 수도 있다. 지능 디바이스측에서 구현하면, 절차 200에서 지능 디바이스가 발송한 지능 디바이스가 이미 음성식별과 음성해석을 한 뒤(후)의 문자형식의 제1요구를 수신하고, 이 때 지능 디바이스 표식을 제1요구에 첨부할 수 있다. 음성식별과 어의해석이 클라우드 서버측에서 구현되면, 절차 200에서 수신하는 지능 디바이스가 발송한 제1요구는 음성형식일 수도 있으며, 이때 음성형식의 제1요구에 대하여 음성식별과 어의해석을 진행할 수 있다. 지능 디바이스측에서 수신한 사용자가 입력한 제1요구는 전부 음성형식이다.
본 실시예의 클라우드 서버는 무한 개의 지능 디바이스를 서포트할 수 있으므로, 지능 디바이스가 클라우드 서버에 발송한 각 메시지는 전부 해당 지능 디바이스 표식을 가지고 있어서 클라우드 서버가 어느 지능 디바이스로부터 발송했는지를 확정할 수 있도록 한다. 클라우드 서버에는 각 지능 디바이스의 웨이크업 단어가 저장되어 있고, 어떤 지능 디바이스의 요구 메서지를 접수 한 후, 요구 메시지 중의 해당 지능 디바이스 표식에 근거하여 미리 저장한 해당 지능 디바이스의 웨이크업 단어를 획득할 수 있다. 그 후, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다. 그렇지 않으면 계속하여 제1요구에 대하여 서비스 만족처리를 한다.
본 실시예의 음성웨이크업 방법은 클라우드 서버측에서 웨이크업 기능을 구현하고, 구현 원리가 상기 도1에 표시한 실시예의 기술방안에 유사하므로 상세한 것은 상기 도1에 표시한 기재를 참조할 수 있으므로 여기에서는 중복하여 기재하지 않는다.
본 실시예의 음성웨이크업 방법은 지능 디바이스가 음성식별 단계에 진입한 후, 클라우드 서버가 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신하는 사용자가 입력한 제1요구를 수신하고, 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다. 본 실시예의 기술방안은 지능 디바이스가 음성식별 단계에 진입한 후, 수신한 요구가 웨이크업 단어이면 해당 요구에 대하여 서비스 만족처리를 하지 않고, 해당 요구가 다시 웨이크업임을 식별할 수 있고, 명령 식별 에러를 일으키지 않으므로 사용자의 기대를 만족시킬 수 있으며, 본 실시예의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
또한 바람직하게는, 절차 200의 "지능 디바이스가 발송한 지능 디바이스 표식과 제1요구를 수신한다" 전에, 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신한 사용자가 입력한 제2요구를 수신하고, 지능 디바이스에서 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 더 포함할 수도 있다.
절차 203의 "수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다" 후, 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 포함할 수도 있고, 예를 들면 제2요구에 대응하는 서비스를 조회하는 것을 정지하거나, 또는 지능 디바이스로 사용자에게 제2요구에 대응하는 서비스를 제공하는 것을 정지하는 것을 더 포함할 수도 있다.
상기 절차의 구체적인 구현 형태는 상기 지능 디바이스측의 기술방안을 참조할 수 있으므로 여기에서는 중복하여 기재하지 않는다. 이상의 기재에 의하면 본 발명의 음성웨이크업 방법은 단독으로 지능 디바이스측에서 구현할 수도 있고, 지능 디바이스와 클라우드 서버의 양측에서 구현할 수도 있다. 이하에서는 양측이 결합한 것을 예로 하여 본 발명의 기술방안을 설명한다.
도3은 본 발명의 음성웨이크업 방법의 실시예 3의 신호도이다. 도3에 나타내는 바와 같이 본 실시예의 음성웨이크업 방법은 구체적으로 이하의 절차를 포함한다.
300, 지능 디바이스가 대기 상태에 있을 때, 사용자는 지능 디바이스에 웨이크업 단어를 음성입력한다.
301, 지능 디바이스는 음성형식의 웨이크업 단어에 대하여 음성식별과 어의해석을 하고, 문자형식의 웨이크업 단어를 획득하고, 사전에 저장한 웨이크업 단어를 획득하고, 수신한 웨이크업 단어가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단하여 확정하고, 지능 디바이스를 웨이크업하고, 지능 디바이스가 음성식별 단계에 진입하도록 한다.
본 실시예에서 지능 디바이스 웨이크업의 1개의 표식으로서 디스플레이가 밝아지는 것일 수도 있다.
302, 지능 디바이스는 디스플레이에서 사용자에게 "이미 음성식별 단계에 진입했습니다"를 제시한다.
303, 지능 디바이스가 음성식별 단계에 진입한 후, 사용자는 두번째로 지능 디바이스에 웨이크업 단어를 음성입력한다.
304, 지능 디바이스는 두번째로 수신한 웨이크업 단어를 음성식별 및 어의해석하고, 어의해석 후의 웨이크업 단어가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단하여 확정하고, 사용자가 지능 디바이스를 다시 웨이크업하는 것을 확정한다.
즉 사용자가 아직 지능 디바이스를 웨이크업하고 있음을 확정하고, 해당 두번째 웨이크업 단어는 음성식별의 명령으로 음성식별되지 않는다.
305, 지능 디바이스가 음성식별 단계에 진입한 후, 사용자는 지능 디바이스에 제1서비스 요구를 음성입력한다.
306, 지능 디바이스는 제1서비스 요구에 대하여 음성식별과 어의해석을 하고, 문자형식의 제1서비스 요구를 획득한다.
307, 지능 디바이스는 클라우드 서버에 지능 디바이스 표식을 가지고 있는 제1서비스 요구를 발송한다.
308, 클라우드 서버는 제1서비스 요구에 근거하여 대응하는 서비스 결과를 획득한다.
예를 들면, 사용자가 지능 디바이스로 "오늘 날씨는 어떻습니까"라는 제1서비스 요구를 발송하면, 클라우드 서버는 네트워크에 접근한다.
309, 클라우드 서버는 지능 디바이스 표식에 근거하여 지능 디바이스에 서비스 만족의 결과를 제공한다.
310, 지능 디바이스는 사용자에게 서비스 만족의 결과를 표시한다.
본 실시예에서는 지능 디바이스측에서 음성식별과 어의해석하고, 클라우드 서버에 의해 서비스 만족을 구현하는 것을 예로 하며, 바람직하게는 상기 실시예에서 지능 디바이스는 임의의 처리도 하지 않고, 완전히 해체하여 수신한 모든 음성형식의 웨이크업 단어 또는 요구만을 전부 직접 클라우드 서버에 발송하여 클라우드 서버에 의해 음성식별, 어의해석 및 서비스 만족처리를 할 수도 있으며, 여기에서는 중복하여 기재하지 않는다.
본 실시예의 음성웨이크업 방법은 상기 기술방안을 이용하여 지능 디바이스가 음성식별 단계에 진입한 후, 웨이크업 단어를 다시 수신하면, 해당 웨이크업 단어에 대하여 서비스 만족처리를 하지 않고, 해당 웨이크업 단어가 지능 디바이스의 다시 웨이크업을 지시하는 것임을 식별할 수 있고, 명령 식별 에러를 일으키지 않고, 사용자의 기대를 만족시킬 수 있다. 본 실시예의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
도4는 본 발명의 음성웨이크업 방법의 실시예 4의 신호도이다. 도4에 나타내는 바와 같이 본 실시예의 음성웨이크업 방법은 구체적으로 이하의 절차를 포함한다.
400, 지능 디바이스가 대기 상태에 있을 때, 사용자는 지능 디바이스에 웨이크업 단어를 음성입력한다.
401, 지능 디바이스는 클라우드 서버에 음성형식의 웨이크업 단어와 지능 디바이스 표식을 발송한다.
402, 클라우드 서버는 음성형식의 웨이크업 단어에 대하여 음성식별 및 어의해석하여 문자형식의 웨이크업 단어를 획득하고, 지능 디바이스 표식에 근거하여 사전에 저장한 해당 지능 디바이스에 대응하는 웨이크업 단어를 획득하고, 수신한 웨이크업 단어가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단하여 확정한다.
403, 클라우드 서버는 지능 디바이스에 웨이크업 제시를 발송하여 지능 디바이스를 음성식별 단계에 진입시킨다.
404, 지능 디바이스는 디스플레이에서 사용자에게 "이미 음성식별 단계에 진입했습니다"를 제시한다.
바람직하게는, 상기 절차 400에 따라 사용자는 웨이크업 단어를 다시 입력하고, 대응하는 절차 401-404의 처리에 의하여 사용자가 지능 디바이스를 다시 웨이크업하는 것을 확정하고, 해당 웨이크업 단어는 다른 음성명령으로 식별되지 않는다.
405, 지능 디바이스가 음성식별 단계에 진입한 후, 사용자가 지능 디바이스에 제1서비스 요구를 음성입력한다.
406, 지능 디바이스는 클라우드 서버에 음성형식의 제1서비스 요구와 지능 디바이스 표식을 발송한다.
407, 클라우드 서버는 제1서비스 요구에 대하여 서비스 만족처리한다.
408, 사용자는 지능 디바이스에 웨이크업 단어를 다시 음성입력한다.
409, 지능 디바이스는 클라우드 서버에 음성형식의 웨이크업 단어와 지능 디바이스 표식을 발송한다.
410, 클라우드 서버는 음성형식의 웨이크업 단어를 음성식별 및 어의해석하여 문자형식의 웨이크업 단어를 획득하고, 지능 디바이스 표식에 근거하여 사전에 저장한 해당 지능 디바이스에 대응하는 웨이크업 단어를 획득하고, 수신한 웨이크업 단어가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단해 확정한다.
411, 클라우드 서버는 사용자가 지능 디바이스를 다시 웨이크업하는 것을 요구하는 것을 확정하고, 제1서비스에 대한 서비스 만족처리를 정지한다.
412, 클라우드 서버가 지능 디바이스에 다시 웨이크업 지시 메시지를 발송한다.
413, 지능 디바이스가 사용자에게 "이미 다시 웨이크업했습니다"를 표시한다.
본 실시예에서 지능 디바이스는 임의의 처리도 하지 않고, 완전히 해체하여 단지 수신한 모두의 음성형식의 웨이크업 단어 또는 요구를 전부 직접 클라우드 서버에 발송하여 클라우드 서버가 음성식별, 어의해석 및 서비스 만족처리를 한다. 바람직하게는, 지능 디바이스측에서 음성식별과 어의해석을 하고, 클라우드 서버는 단지 서비스 만족처리만을 구현할 수도 있고, 여기에서는 중복하여 기재하지 않는다.
본 실시예의 음성웨이크업 방법은 상기 기술방안을 이용하여 지능 디바이스가 음성식별 단계에 진입한 후, 제1요구에 대하여 서비스 만족처리를 한 후, 다시 웨이크업 단어를 수신하면, 해당 웨이크업 단어에 대하여 서비스 만족처리를 하지 않고 해당 웨이크업 단어는 지능 디바이스의 다시 웨이크업을 지시하는데 이용하는 것임을 식별할 수 있고, 그 전의 서비스 만족처리를 정지하고, 명령 식별 에러를 일으키지 않으므로 사용자의 기대를 만족시킬 수 있고, 본 실시예의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
도5는 본 발명의 지능 디바이스 실시예 1의 구조도이다. 도5에 나타내는 바와 같이 본 실시예의 지능 디바이스는 구체적으로,
지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제1요구를 수신하는 수신모듈(10)과,
판단 어의해석 후의 수신모듈(10)이 수신한 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하는 판단모듈(11)과,
판단모듈(11)가 사전에 저장한 상기 웨이크업 단어와 일치함을 판단하면, 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정하는 확정모듈(12)을 포함한다.
본 실시예의 지능 디바이스는 상기 모듈을 이용하여 음성웨이크업 처리를 구현하는 구현 원리 및 기술효과가 상기 관련 방법의 실시예의 구현과 같으므로, 상세한 것은 상기 관련 방법의 실시예의 기재를 참조할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
도6은 본 발명의 지능 디바이스 실시예 2의 구조도이다. 도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 상기 도5에 표시한 실시예의 기술방안의 기초상에서 이하의 기술방안을 더 포함할 수 있다.
도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 서비스 만족처리모듈(13)을 더 포함할 수도 있다.
여기에서 수신모듈(10)은 상기 사용자가 음성방식으로 입력한 제2요구를 더 수신한다.
서비스 만족처리모듈(13)은 수신모듈(10)이 수신한 상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하고, 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작한다.
또한 서비스 만족처리모듈(13)은 확정모듈(12)이 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정할 때 제2요구에 대응하는 서비스 만족처리를 정지한다.
또한 바람직하게는, 도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 발송모듈(14)을 더 포함한다.
수신모듈(10)은 사용자가 음성방식으로 입력한 제2요구를 더 수신한다.
발송모듈(14)는 클라우드 서버에 지능 디바이스 표식과 수신모듈(10)이 수신한 제2요구를 발송하여 클라우드 서버가 지능 디바이스상에서 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하게 한다.
또한 발송모듈(14)은 클라우드 서버에 지능 디바이스 표식을 가지고 있는 다시 웨이크업 통지 메시지를 발송하여 클라우드 서버가 지능 디바이스 표식에 근거하여 대응하는 지능 디바이스의 다시 웨이크업을 확정하도록 하고, 제2요구에 대응하는 서비스 만족처리를 정지한다.
또는, 발송모듈(14)은 클라우드 서버에 지능 디바이스 표식과 수신모듈(10)이 수신한 제1요구를 발송하여 클라우드 서버가 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스의 다시 웨이크업에 이용되는 것임을 확정하고, 제2요구에 대응하는 서비스 만족처리를 정지한다.
또한 바람직하게는 본 실시예의 지능 디바이스에서 서비스 만족처리모듈(13)은 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못한다. 그 때에만 발송모듈(14)을 촉발하여 상기 조작을 실행한다.
또한 바람직하게는 도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 획득모듈(15)와 표시모듈(16)을 더 포함한다.
획득모듈(15)는 현재 시각과 발송모듈(14)이 클라우드 서버에 제2요구를 발송하는 시각의 시간차를 획득한다.
표시모듈(16)은 클라우드 서버가 발송한 제2요구의 서비스 피드백을 수신할 때까지 사용자에게 획득모듈(15)이 획득한 시간차를 표시하고, 서비스 피드백을 수신하면 시간차의 표시를 취소한다.
수신모듈(10)은 사용자가 표시된 시간차에 근거하여 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 웨이크업 단어를 더 수신하고, 지능 디바이스를 다시 웨이크업한다.
또는, 바람직하게는, 도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 검출모듈(17)을 더 포함한다.
검출모듈(17)은 발송모듈(14)이 제2요구를 발송한 후의 미리 설정한 시간길이내에 수신모듈(10)이 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출한다.
표시모듈(16)은 검출모듈(17)이 제2요구를 발송한 후의 미리 설정한 시간길이내에 클라우드 서버의 서비스 피드백을 수신하지 못한 것을 검출하면, 사용자에게 다시 웨이크업의 제시 메시지를 표시한다.
수신모듈(10)은 사용자가 음성입력한 웨이크업 단어를 수신하고, 지능 디바이스를 다시 웨이크업한다.
본 실시예의 지능 디바이스에 포함한 상기 모듈은 결합할 수 있는 방식으로 임의로 조합하여 본 발명의 바람직한 실시예를 형성할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
본 실시예의 지능 디바이스는 상기 모듈을 이용하여 음성웨이크업 처리를 구현하는 구현 원리 및 기술효과가 상기 관련 방법의 실시예의 구현과 같으므로, 상세한 것은 상기 관련 방법의 실시예의 기재를 참조할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
도7은 본 발명의 클라우드 서버의 실시예 1의 구조도이다. 도7에 나타내는 바와 같이 본 실시예의 클라우드 서버는 구체적으로 이하의 모듈을 포함한다.
수신모듈(20)은 지능 디바이스가 음성식별 단계에 진입한 후, 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신한 사용자가 입력한 제1요구를 수신한다.
획득모듈(21)은 수신모듈(20)이 수신한 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득한다.
판단모듈(22)는 어의해석 후의 수신모듈(20)이 수신한 제1요구가 획득모듈(21)이 획득한 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단한다.
확정모듈(23)은 판단모듈(22)이 어의해석 후의 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치함을 판단하면, 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다.
본 실시예의 클라우드 서버에서, 상기 모듈을 이용하여 음성웨이크업 처리를 구현하는 구현 원리 및 기술효과가 상기 관련 방법의 실시예의 구현과 같으므로, 상세한 것은 상기 관련 방법의 실시예의 기재를 참조할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
도8은 본 발명의 클라우드 서버의 실시예 2의 구조도이다. 도8에 나타내는 바와 같이 본 실시예의 클라우드 서버는 상기 도7에 표시한 실시예의 기술방안의 기초상에서 이하의 기술방안을 더 포함할 수 있다.
도8에 나타내는 바와 같이 본 실시예의 클라우드 서버는 서비스 만족처리모듈(24)을 더 포함한다.
수신모듈(20)은 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신한 사용자가 입력한 제2요구를 더 수신한다.
서비스 만족처리모듈(24)은 지능 디바이스에서 수신모듈(20)이 수신한 제2요구에 대응하는 서비스 만족처리의 실시를 시작한다.
또한 서비스 만족처리모듈(24)은 확정모듈(23)이 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다. 제2요구에 대응하는 서비스 만족처리를 정지한다.
본 실시예의 클라우드 서버에서, 상기 모듈을 이용하여 음성웨이크업 처리를 구현하는 구현 원리 및 기술효과가 상기 관련 방법의 실시예의 구현과 같으므로, 상세한 것은 상기 관련 방법의 실시예의 기재를 참조할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
도9는 본 발명의 음성웨이크업 시스템의 실시예의 구조도이다. 도9에 나타내는 바와 같이 본 실시예의 웨이크업 시스템은 지능 디바이스(30)과 클라우드 서버(40)을 포함한다.
본 실시예의 지능 디바이스(30)은 상기 도6에 표시한 실시예의 클라우드 서버(40)과 대화할 수 있는 지능 디바이스를 이용할 수도 있고, 본 실시예의 클라우드 서버(40)은 상기 도7 또는 도8에 표시한 실시예의 클라우드 서버를 이용할 수 있다. 또한, 구체적으로 상기 도2, 도3 또는 도4에 표시한 실시예의 음성웨이크업 방법을 이용할 수도 있고, 상세하게는 상기 관련 실시예의 기재를 참조할 수 있으므로 여기에서는 중복하여 기재하지 않는다.
도10은 본 발명의 지능 디바이스 실시예의 구조도이다. 도10에 나타내는 바와 같이 본 실시예의 지능 디바이스는 1개 또는 복수의 프로세서(30)과, 메모리(40)을 포함하고, 메모리(40)은 1개 또는 복수의 프로그램을 기억하고, 메모리(40)에 기억된 1개 또는 복수의 프로그램이 1개 또는 복수의 프로세서(30)에 의해 실행되면, 1개 또는 복수의 프로세서(30)이 상기 도1에 나타낸 실시예의 음성웨이크업 방법을 구현한다. 도10에 표시한 실시예는 복수의 프로세서(30)을 포함하고 있는 것을 예로 한다.
같은 이유에 의해, 본 실시예의 클라우드 서버는, 상기 도10에 표시한 구조를 이용할 수도 있고, 1개 또는 복수의 프로세서(30)과 메모리(10)을 포함하고, 여기에서, 메모리(40)에 기억된 1개 또는 복수의 프로그램이 1개 또는 복수의 프로세서(30)에 의하여 실행되어 1개 또는 복수의 프로세서(30)이 도2에 나타낸 실시예의 음성웨이크업 방법을 구현하게 한다.
예를 들면, 도11은 본 발명에서 제공하는 클라우드 서버의 예시도이다. 도11은 본 발명의 실시형태의 예시적인 클라우드 서버(12a)를 나타내기 위한 블록 도을 나타낸다. 도11에 표시한 클라우드 서버(12a)는 단지 1개의 예시로서 본 발명의 실시예의 기능 및 사용 범위에 임의의 제한을 주지 않는다.
도11에 나타내는 바와 같이 클라우드 서버(12a)는 통용의 계산 디바이스의 형식으로 표현된다. 클라우드 서버(12a)의 구성 요소는 1개 또는 복수의 프로세서(16a), 시스템 메모리(28a)와, 다른 시스템 구성 요소(시스템 메모리(28a)와 프로세서(16a)를 포함)을 연결하기 위한 버스(18a)를 포함할 수도 있지만 이것들에 한정되지 않는다.
버스(18a) 은 복수 종류 구조 중의 하나 또는 복수 종류를 표시하고, 메모리 버스 또는 메모리 제어기, 외장 버스, 그래픽스 고속화 포트, 프로세서 또는 복수 종류의 버스 구조 중의 임의의 버스 구조의 로컬 버스 등을 포함한다. 예를 들면, 이러한 체계 구조는 공업기준체계구조(ISA)버스, 미크로 채널 아키텍처 (MAC)버스, 증강형 ISA버스, 비디오 전자기준협회(VESA) 로컬 버스 및 주변 구성요소 상호연결(PCI)버스 등을 포함할 수 있고, 이에 한정되지 않는다.
클라우드 서버(12a) 는 대표적으로 복수개의 컴퓨터 시스템 가독매체를 포함한다. 이러한 매체는 컴퓨터 시스템/서버(12a) 에 의해 접속할 수 있는 이용가능한 임의의 매체로써 휘발성 및 비휘발성 매체와, 포터블 또는 언포터블 매체를 포함할 수도 있다.
시스템 메모리(28a) 은 휘발성 메모리 형식의 컴퓨터 시스템 가독매체 예를 들면, 랜덤 엑세스 메모리(RAM) (30a) 및/ 또는 고속캐쉬메모리(32a) 를 포함할 수도 있다. 또한 다른 포터블 또는 언포터블한 휘발성/비휘발성 컴퓨터 시스템 기억매체를 포함할 수도 있다. 단지 하나의 예로써 기억 시스템(34a)는 언포터블한 비휘발성 자기매체(도11에 표시하지 않았지만 일반적으로 "하드웨어 드라이버"라고 불린다)에 접근하는데 사용할 수도 있다. 도11에 표시하지 않았지만 포터블한 비휘발성 자기 디스크 (예를 들면, "플로피디스크"))에 엑세스하는 자기 디스크 드라이버, 및 포터블한 비휘발성 광디스크 (예를 들면, CD-ROM, DVD-ROM 또는 기타 광매체)에 접근할 수 있는 광디스크 드라이버일 수도 있다. 이 경우, 각 드라이버는 1개 또는 복수개의 데이터 매체 인터페이스를 통하여 버스(18a) 에 접속할 수 있다. 시스템 메모리(28a) 은 적어도 1개의 프로그램 제품을 포함할 수도 있고, 해당 프로그램 제품은 1조 (예를 들면, 적어도 1개의)의 프로그램 모듈를 구비하고 있고, 이 프로그램 모듈은 본 발명의 각 실시예의 기능을 실행하게 배치되었다.
한 조 (적어도 1개의)의 프로그램 모듈(42a)의 프로그램/ 실용적인 앱(40a) 은 예를 들면 시스템 메모리(28a) 에 저장할 수 있고, 이러한 프로그램 모듈(42a) 은 조작 시스템, 1개 또는 복수개의 애플리케이션 프로그램, 기타 프로그램 모듈 및 프로그램 데이터를 포함할 수 있으나 이에 한정되지 않는다. 이상의 예에서 매개 또는 임의의 조합은 네트워크 환경에서의 구현을 포함한다. 프로그램 모듈(42a) 은 일반적으로 본 발명에 기재한 실시예에 있어서의 기능 및 / 또는 방법을 실행한다.
클라우드 서버(12a) 는 1개 또는 복수개의 외부 디바이스14a(예를 들면, 키보드, 지시설비, 디스플레이(24a)등)와 통신할 수 있으며, 1개 또는 복수개의 사용자가 해당 컴퓨터 시스템/서버(12a) 과 대화할 수 있게 하는 디바이스와 통신할 수도 있고, 및 / 또는 해당 컴퓨터 시스템/서버(12a) 는 1개 또는 복수개의 다른 계산 디바이스와 통신할 수 있는 임의의의 디바이스 (예를 들면, 네트워크 보드, 모뎀 등)와 통신할 수 있다. 이러한 통신은 입력/출력(I/O)인터페이스(I/O)*j22a*j을 통해 실행할 수 있다. 또한 클라우드 서버(12a) 는 네트워크 어댑터(20a) 로 1개 또는 복수개의 네트워크 (예를 들면, 로컬 네트워크(LAN), 광역 네트워크(WAN) 및 / 또는 공공 네트워크, 예를 들면, 인터넷)와 통신할 수 있다. 도에 나타내는 바와 같이 네트워크 어댑터(20a)은 버스(18a) 를 통하여 컴퓨터 시스템/서버(12a)의 기타 모듈과 통신한다. 면에 포시하지 않았지만, 컴퓨터 시스템/서버(12a)을 결합하여 미크로 코드, 디바이스 드라이버, 장황처리유닛, 외부 자기 디스크 드라이버 어레이, RAID시스템, 자기 테이프 드라이버 및 데이터 백업 기억 시스템 등을 포함하는 기타 하드웨어 및 / 또는 소프트웨 모듈을 이용할 수 있지만 이에 한정되지 않는다.
프로세서(16a)는 시스템 메모리(28a)에 저장되어 있는 프로그램을 실행하여 여라가지 기능 앱 및 데이터 처리를 실행한다. 예를 들면, 상기 실시예에 나타낸 웨이크업 방법을 구현한다.
본 발명은 컴퓨터 프로그램을 저장한 컴퓨터 가독매체를 더 제공하고, 해당 프로그램이 프로세서에 의해 실행될 때 상기 도1에 표시한 실시예의 웨이크업 방법, 또는 도2에 나타낸 실시예의 웨이크업 방법을 구현한다.
본 실시예의 컴퓨터 가독매체는 상기 도11에 나타낸 실시예에서의 시스템 메모리(28a) 중의 RAM(30a), 및 / 또는 고속 캐쉬메모리(32a), 및 / 또는 기억 시스템(34a)를 포함할 수도 있다.
과학기술의 발전에 따라, 컴퓨터 프로그램의 전파는 유형의 매체에 한정되지 않고, 직접 네트워크에서 다운로드할 수도 있고, 또는 다른 방식으로 획득할 수도 있다. 때문에 본 실시예의 컴퓨터 가독매체는 유형의 매체를 포함할 뿐만 아니라, 무형의 매체도 포함할 수도 있다.
본 실시예의 컴퓨터 가독매체는 1개 또는 복수개의 컴퓨터 가독매체의 임의의 조합을 사용할 수 있다. 컴퓨터 가독매체는 컴퓨터 가독 신호 매체, 또는 컴퓨터 가독 기억매체일 수도 있다. 컴퓨터 가독기억매체는 예를 들면 전기, 자기, 광, 전자기, 적외선, 또는 반도체 시스템, 장치 또는 디바이스, 또는 이것들의 임의의 조합일 수도 있고, 이에 한정되지 않는다. 컴퓨터 가독 기억 매체의 보다 구체적인 예(비궁극적 리스트)로서 1개 또는 복수개 도선을 포함하는 전기적 접속, 휴대형 컴퓨터 디스크, 하드 디스크, 랜덤 엑세스 메모리(RAM), 읽기전용 메모리(ROM), EPROM(EPROM 또는 플래시 메모리), 광섬유, 휴대식 컴팩트 디스크 읽기전용 메모리(CD-ROM), 광 기억장치, 자기 기억장치, 또는 이것들의 임의의 적절한 조합을 포함한다. 본 명세서에 있어서 컴퓨터 가독 기억 매체는 명령 실행 시스템, 장치 또는 디바이스에 의해 이용 또는 이것들과 조합하여 이용할 수 있는 프로그램을 포함하거나 또는 저장하는 임의의 유형매체일 수도 있다.
컴퓨터 가독 신호 매체는 기저 대역 또는 반송파의 일부로서 전파하는 컴퓨터 가독 프로그램 코드를 탑재한 데이터 신호를 포함할 수도 있다. 이러한 전파하는데이터 신호는 전자기신호, 광 신호, 또는 상기의 임의의 적절한 조합을 포함하는 여러가지 형태를 취할 수 있고, 이에 한정되지 않는다. 컴퓨터 가독 신호 매체는 컴퓨터 가독 기억매체 이외의 임의의 컴퓨터 가독매체일 수도 있고, 해당 컴퓨터 가독매체는 명령 실행 시스템, 장치 또는 디바이스에 의해 사용되거나 또는 이것들에 결합되어서 사용되는 프로그램을 발송하고, 전파하고, 송신할 수 있다.
컴퓨터 가독매체에 포함되는 프로그램 코드는 무선, 와이어, 케이블, RF등, 또는 이 이것들의 임의의 적절한 조합의 임의의 적당한 매체를 이용하여 송신할 수 있고, 이에 한정되지 않는다.
1개 또는 복수개의 프로그램 설계언어 또는 그 조합으로 본 발명의 동작을 실행하기 위한 컴퓨터 프로그램 코드를 편집할 수 있으며, 상기 프로그램 설계언어는 오브젝트 지향 프로그래밍 언어 예를 들면 Java, Smalltalk, C++, 및 상용의 과정식 프로그램 설계언어 예를 들면 "C" 언어 또는 유사한 프로그램 설계언어를 포함한다. 프로그램 코드는 완전히 사용자의 컴퓨터상에서 실행할 수 있고, 일부는 사용자의 컴퓨터에서 실행하여 1개의 독립적인 소프트웨어 패키지로서 실행할 수 있고, 일부는 사용자의 컴퓨터에서 일부는 원격컴퓨터상에서 실행할 수도 있고, 또는 완전히 원격 컴튜터 또는 서버에서 실행할 수도 있다. 원격컴퓨터에 관한지만 경우, 원격컴퓨터는 로컬 네트워크(LAN) 또는 광역네트워크(WAN)를 포함하는 임의의 종류의 네트워크를 통하여 사용자 컴퓨터에 접속할 수도 있고, 또는 외부 컴퓨터 (예를 들면, 인터넷 서비스 제공자를 이용하여 인터넷을 통해 접속)에 접속할 수 있다.
본 발명에서 제공한 여러개의 실시예에서 공개한 시스템, 장치와 방법은 기타 방식을 통하여 구현할 수 있음을 이해할 것이다. 예를 들면, 상술한 장치의 실시예는 단지 예시적인 것이며, 예를 들면 상기 유닛의 구분은 단지 일종 론리적 기능에 대한 구분이며 실제 구현할 때 다른 구분방식을 이용할 수 있다.
상기 분리 부품으로 설명한 유닛은 물리상 분리한 것일 수도 있고 분리되지 않은 것일 수도 있으며, 유닛으로 표시한 부품은 물리적 유닛일 수도 있고 아닐 수도 있으며, 즉 동일한 위치에 있을 수도 있고, 복수개의 네트워크 유닛에 분포되어 있을 수도 있다. 실지 필요에 의해 그 중 일부분 또는 전부 수단을 선택하여 본 실시예의 방안 목적을 구현할 수 있다.
그리고 본 발명의 각 실시예 중의 각 기능유닛은 1의 처리유닛에 집적되어 있을 수도 있고, 각 유닛이 물리적으로 단독으로 존재할 수도 있으며, 2이상의 유닛이 1의 유닛에 집적되어 있을 수도 있다. 상기 집적된 유닛은 하드웨어의 형식으로 구현될 수도 있고, 하드웨어에 소프트웨어를 결합한 기능유닛의 형식으로 구현될 수도 있다.
상기 소프트웨어 기능유닛의 형식으로 구현한 집적된 유닛은 하나의 컴퓨터 가독 기억매체에 저장할 수 있다. 상기 소프트웨어 기능유닛은 하나의 기억매체에 저장할 수 있으며 일련의 명령을 포함하여 1의 컴퓨터설비(PC, 서버, 또는 네트워크 설비 등) 또는 프로세서(processor)로 하여금 본 발명의 각 실시예의 상술한 방법의 일부분 절차를 실행하도록 한다. 상기 기억매체는 U디스크, 포터블 하드디스크, ROM(Read-Only Memory, ROM), RAM(Random Access Memory, RAM), 디스켓 또는 광디스켓 등 각종 프로그램 코드를 저장할 수 있는 매체를 포함할 수 있다.
이상은 단지 본 발명의 비교적 바람직한 실시예일 뿐 본 발명을 제한하기 위함이 아니며, 본 발명의 요지와 원칙내에서 진행한 임의의 수정 또는 등가치환 및 개량 등은 전부 본 발명의 보호 범위에 포함된다.
Claims (18)
- 지능 디바이스가 웨이크업되어 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제2요구를 수신하고, 상기 제2요구에 대응하는 서비스 만족처리를 수행하며,
사용자가 음성방식으로 입력한 제1요구를 수신하고;
상기 지능 디바이스가 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고;
일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 포함하고,
상기 사용자가 음성방식으로 입력한 제2요구를 수신하고, 상기 제2요구에 대응하는 서비스 만족처리를 수행하는 방법은,
상기 사용자가 음성방식으로 입력한 제2요구를 수신하고;
클라우드 서버에 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하는 것을 포함하고,
상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것은,
상기 클라우드 서버에 상기 지능 디바이스 표식이 첨부된 다시 웨이크업 통지 메시지를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 대응하는 상기 지능 디바이스를 확정하여 다시 웨이크업하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지하거나, 또는
상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제1요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하게 하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지시키는 것을 포함하는 것을 것을 특징으로 하는 음성웨이크업 방법. - 청구항 1에 있어서,
상기 사용자가 음성방식으로 입력한 제2요구를 수신하고, 상기 제2요구에 대응하는 서비스 만족처리를 수행하는 방법은,
상기 사용자가 음성방식으로 입력한 제2요구를 수신하고;
상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하는 경우, 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 포함하는 것을 포함하는 것을 특징으로 하는 음성웨이크업 방법. - 삭제
- 청구항 1에 있어서,
상기 사용자가 음성방식으로 입력한 제2요구를 수신한 후, 클라우드 서버에 상기 지능 디바이스 표식을 가지고 있는 상기 제2요구를 발송하기 전에 상기 방법은,
상기 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못하는 경우, 상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하는 것을 특징으로 하는 음성웨이크업 방법. - 청구항 1에 있어서,
클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송한 후, 상기 방법은,
현재 시각과 상기 클라우드 서버에 상기 제2요구를 발송하는 시각의 시간차를 획득하고;
상기 클라우드 서버가 발송한 상기 제2요구의 서비스 피드백을 수신할 때까지 상기 사용자에게 상기 시간차를 표시하고, 서비스 피드백을 수신하면 상기 시간차의 표시를 취소하고;
상기 사용자가 표시된 상기 시간차에 근거하여 상기 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 더 포함하거나,
또는, 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송한 후, 상기 방법은,
상기 제2요구를 발송한 후의 미리 설정 시간내에 상기 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고;
수신하지 않았으면 상기 사용자에게 다시 웨이크업의 제시 메시지를 표시하고;
상기 사용자가 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 더 포함하는 것을 특징으로 하는 음성웨이크업 방법. - 삭제
- 삭제
- 지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제2요구 및 제1요구를 수신하는 수신모듈과,
어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하는 판단모듈과,
상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 확정모듈과,
상기 제2요구에 대응하는 서비스 만족처리를 정지하는 서비스 만족처리모듈을 포함하고,
상기 지능 디바이스는 발송모듈을 더 포함하고,
상기 수신모듈은 상기 사용자가 음성방식으로 입력한 제2요구를 수신하고,
상기 발송모듈은 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하고,
상기 발송모듈은 상기 클라우드 서버에 상기 지능 디바이스 표식이 첨부된 다시 웨이크업 통지 메시지를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 대응하는 상기 지능 디바이스를 확정하여 다시 웨이크업하고 상기 제2요구에 대응하는 서비스 만족처리를 정지하고,
또는, 상기 발송모듈은 상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제1요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하게 하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 특징으로 하는 지능 디바이스. - 청구항 8에 있어서,
상기 수신모듈은 상기 사용자가 음성방식으로 입력한 제2요구를 수신하고,
상기 서비스 만족처리모듈은 상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하는 경우, 상기 제2요구에 대응하는 서비스 만족처리를 시작하는 것을 특징으로 하는 지능 디바이스. - 삭제
- 청구항 8에 있어서,
상기 서비스 만족처리모듈은 상기 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못하는 경우, 상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하는 것을 특징으로 하는 지능 디바이스. - 청구항 8에 있어서,
상기 지능 디바이스는 획득모듈과 표시모듈을 더 포함하고,
상기 획득모듈은 현재 시각과 상기 클라우드 서버에 상기 제2요구를 발송하는 시각의 시간차를 획득하고,
상기 표시모듈은 상기 클라우드 서버가 발송한 상기 제2요구의 서비스 피드백을 수신할 때까지 상기 사용자에게 상기 시간차를 표시하고, 서비스 피드백을 수신하면 상기 시간차의 표시를 취소하고,
상기 수신모듈은 상기 사용자가 표시된 상기 시간차에 근거하여 상기 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하고,
또는, 상기 지능 디바이스는 검출모듈을 더 포함하고,
상기 검출모듈은 상기 제2요구를 발송한 후의 미리 설정 시간내에 상기 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고,
상기 표시모듈은 상기 검출모듈이 상기 제2요구후의 미리 설정한 시간길이내에 상기 클라우드 서버의 서비스 피드백을 수신하지 못한 것을 검출하면, 상기 사용자에게 다시 웨이크업의 제시 메시지를 표시하고,
상기 수신모듈은 상기 사용자가 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 특징으로 하는 지능 디바이스. - 삭제
- 삭제
- 삭제
- 하나 또는 복수의 프로세서와,
하나 또는 복수의 프로그램을 저장한 메모리를 포함하는 지능 디바이스로서,
상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행되면 상기 하나 또는 복수의 프로세서가 상기 청구항 1, 2, 4, 및 5 중 임의의 1항에 기재된 방법을 구현하는 것을 특징으로 하는 지능 디바이스. - 삭제
- 컴퓨터 프로그램을 기억하는 컴퓨터 가독매체로서,
상기 프로그램이 프로세서에 의해 실행되면 상기 청구항 1, 2, 4, 및 5 중 임의의 1항에 기재된 방법을 구현하는 것을 특징으로 하는 컴퓨터 가독매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710543572.8A CN107564517A (zh) | 2017-07-05 | 2017-07-05 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
CN2017105435728 | 2017-07-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190005104A KR20190005104A (ko) | 2019-01-15 |
KR102096156B1 true KR102096156B1 (ko) | 2020-04-06 |
Family
ID=60973010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180030250A KR102096156B1 (ko) | 2017-07-05 | 2018-03-15 | 웨이크업 방법, 디바이스 및 가독매체 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10964317B2 (ko) |
EP (2) | EP3447763A1 (ko) |
JP (1) | JP6728540B2 (ko) |
KR (1) | KR102096156B1 (ko) |
CN (1) | CN107564517A (ko) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107564517A (zh) | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
CN110275691A (zh) * | 2018-03-15 | 2019-09-24 | 阿拉的(深圳)人工智能有限公司 | 智能语音唤醒的自动回复方法、装置、终端及存储介质 |
CN108665900B (zh) | 2018-04-23 | 2020-03-03 | 百度在线网络技术(北京)有限公司 | 云端唤醒方法及系统、终端以及计算机可读存储介质 |
WO2019218368A1 (zh) * | 2018-05-18 | 2019-11-21 | 深圳傲智天下信息科技有限公司 | 一种tws耳机、腕带式ai语音交互装置及系统 |
CN108735216B (zh) * | 2018-06-12 | 2020-10-16 | 广东小天才科技有限公司 | 一种基于语义识别的语音搜题方法及家教设备 |
CN109377993A (zh) * | 2018-10-12 | 2019-02-22 | 上海庆科信息技术有限公司 | 智能语音系统及其语音唤醒方法及智能语音设备 |
CN109389977B (zh) * | 2018-11-01 | 2021-07-16 | 腾讯大地通途(北京)科技有限公司 | 一种语音交互方法及装置 |
CN109637542A (zh) * | 2018-12-25 | 2019-04-16 | 圆通速递有限公司 | 一种语音外呼系统 |
US11276399B2 (en) * | 2019-04-11 | 2022-03-15 | Lg Electronics Inc. | Guide robot and method for operating the same |
CN111862965A (zh) * | 2019-04-28 | 2020-10-30 | 阿里巴巴集团控股有限公司 | 唤醒处理方法、装置、智能音箱及电子设备 |
KR102228549B1 (ko) * | 2019-06-11 | 2021-03-16 | 엘지전자 주식회사 | 음성 인에이블 디바이스 선택 방법, 음성 인에이블 디바이스 선택 장치 및 이를 제어하는 지능형 컴퓨팅 디바이스 |
CN112152890B (zh) * | 2019-06-28 | 2022-01-21 | 海信视像科技股份有限公司 | 一种基于智能音箱的控制系统及方法 |
CN110706696A (zh) * | 2019-09-25 | 2020-01-17 | 珠海格力电器股份有限公司 | 一种语音控制方法及装置 |
CN110890092B (zh) * | 2019-11-07 | 2022-08-05 | 北京小米移动软件有限公司 | 唤醒控制方法及装置、计算机存储介质 |
CN110827799B (zh) * | 2019-11-21 | 2022-06-10 | 百度在线网络技术(北京)有限公司 | 用于处理语音信号的方法、装置、设备和介质 |
CN110827820B (zh) * | 2019-11-27 | 2022-09-27 | 北京梧桐车联科技有限责任公司 | 语音唤醒方法、装置、设备、计算机存储介质及车辆 |
CN111243700B (zh) * | 2020-01-15 | 2023-09-29 | 创业慧康科技股份有限公司 | 一种电子病历输入方法及装置 |
CN111243577B (zh) * | 2020-03-27 | 2022-04-19 | 四川虹美智能科技有限公司 | 语音交互方法及装置 |
CN111522592A (zh) * | 2020-04-24 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的智能终端唤醒方法和装置 |
CN111554288A (zh) * | 2020-04-27 | 2020-08-18 | 北京猎户星空科技有限公司 | 智能设备的唤醒方法、装置、电子设备及介质 |
CN111722696B (zh) * | 2020-06-17 | 2021-11-05 | 思必驰科技股份有限公司 | 用于低功耗设备的语音数据处理方法和装置 |
CN111833874B (zh) * | 2020-07-10 | 2023-12-05 | 上海茂声智能科技有限公司 | 一种基于标识符的人机交互方法、系统、设备和存储介质 |
KR20220037846A (ko) * | 2020-09-18 | 2022-03-25 | 삼성전자주식회사 | 음성 인식을 수행하기 위한 전자 장치를 식별하기 위한 전자 장치 및 그 동작 방법 |
CN113012697A (zh) * | 2021-03-05 | 2021-06-22 | 北京嘀嘀无限科技发展有限公司 | 一种信息交互方法、装置及电子设备 |
CN113921016A (zh) * | 2021-10-15 | 2022-01-11 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、装置、电子设备以及存储介质 |
CN114915514B (zh) * | 2022-03-28 | 2024-03-22 | 青岛海尔科技有限公司 | 意图的处理方法和装置、存储介质及电子装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160180844A1 (en) * | 2014-12-19 | 2016-06-23 | Lenovo (Singapore) Pte, Ltd. | Executing a voice command during voice input |
US20170169817A1 (en) * | 2015-12-09 | 2017-06-15 | Lenovo (Singapore) Pte. Ltd. | Extending the period of voice recognition |
US20180336894A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000089789A (ja) | 1998-09-08 | 2000-03-31 | Fujitsu Ltd | 音声認識装置及び記録媒体 |
US7058575B2 (en) * | 2001-06-27 | 2006-06-06 | Intel Corporation | Integrating keyword spotting with graph decoder to improve the robustness of speech recognition |
JP3632679B2 (ja) | 2002-06-21 | 2005-03-23 | ブラザー工業株式会社 | 通信システム及び通信機器 |
JP2004096520A (ja) | 2002-09-02 | 2004-03-25 | Hosiden Corp | 音声認識リモコン |
US8154227B1 (en) * | 2003-11-26 | 2012-04-10 | Liontech Trains Llc | Model train control system |
KR100621593B1 (ko) * | 2004-09-24 | 2006-09-19 | 삼성전자주식회사 | 다중양식의 입력을 이용하는 통합 원격 제어 장치 및 방법 |
US20080147652A1 (en) * | 2006-12-14 | 2008-06-19 | Bellsouth Intellectual Property Corporation | Physical address verification within electronic documents |
US8041012B2 (en) | 2007-03-06 | 2011-10-18 | Embarq Holdings Company, Llc | System and method for voice-activated dialing over implicit and explicit NFA trunks |
US20110054899A1 (en) | 2007-03-07 | 2011-03-03 | Phillips Michael S | Command and control utilizing content information in a mobile voice-to-speech application |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8090750B2 (en) * | 2008-12-30 | 2012-01-03 | International Business Machines Corporation | Prompting of an end user with commands |
US9421475B2 (en) * | 2009-11-25 | 2016-08-23 | Hallmark Cards Incorporated | Context-based interactive plush toy |
US20140372114A1 (en) * | 2010-08-06 | 2014-12-18 | Google Inc. | Self-Directed Machine-Generated Transcripts |
US9921803B2 (en) * | 2010-08-23 | 2018-03-20 | Nokia Technologies Oy | Audio user interface apparatus and method |
US9099087B2 (en) | 2010-09-03 | 2015-08-04 | Canyon IP Holdings, LLC | Methods and systems for obtaining language models for transcribing communications |
CN102682771B (zh) | 2012-04-27 | 2013-11-20 | 厦门思德电子科技有限公司 | 一种适用于云平台的多语音控制方法 |
KR20130133629A (ko) * | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
US20140006825A1 (en) * | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
WO2014017144A1 (ja) | 2012-07-27 | 2014-01-30 | Jsr株式会社 | ネガ型レジストパターン形成方法及びフォトレジスト組成物 |
US8849667B2 (en) | 2012-07-31 | 2014-09-30 | Novospeech Ltd. | Method and apparatus for speech recognition |
US9576574B2 (en) * | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
WO2014055076A1 (en) | 2012-10-04 | 2014-04-10 | Nuance Communications, Inc. | Improved hybrid controller for asr |
US10304465B2 (en) * | 2012-10-30 | 2019-05-28 | Google Technology Holdings LLC | Voice control user interface for low power mode |
WO2014107413A1 (en) * | 2013-01-04 | 2014-07-10 | Kopin Corporation | Bifurcated speech recognition |
US20140297288A1 (en) * | 2013-03-29 | 2014-10-02 | Orange | Telephone voice personal assistant |
CN103280217B (zh) * | 2013-05-02 | 2016-05-04 | 锤子科技(北京)有限公司 | 一种移动终端的语音识别方法及其装置 |
US9786296B2 (en) | 2013-07-08 | 2017-10-10 | Qualcomm Incorporated | Method and apparatus for assigning keyword model to voice operated function |
US20150039316A1 (en) * | 2013-07-31 | 2015-02-05 | GM Global Technology Operations LLC | Systems and methods for managing dialog context in speech systems |
US9548047B2 (en) * | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
EP2851808A3 (en) * | 2013-09-19 | 2015-04-15 | Maluuba Inc. | Hybrid natural language processor |
US9443522B2 (en) * | 2013-11-18 | 2016-09-13 | Beijing Lenovo Software Ltd. | Voice recognition method, voice controlling method, information processing method, and electronic apparatus |
US9373321B2 (en) * | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US8719039B1 (en) * | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
CN103714815A (zh) | 2013-12-09 | 2014-04-09 | 何永 | 语音控制方法及其设备 |
US8938394B1 (en) * | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
CN103956168A (zh) | 2014-03-29 | 2014-07-30 | 深圳创维数字技术股份有限公司 | 一种语音识别方法、装置及终端 |
US9640183B2 (en) | 2014-04-07 | 2017-05-02 | Samsung Electronics Co., Ltd. | Speech recognition using electronic device and server |
US9953632B2 (en) * | 2014-04-17 | 2018-04-24 | Qualcomm Incorporated | Keyword model generation for detecting user-defined keyword |
US9620999B2 (en) * | 2014-04-22 | 2017-04-11 | Baldor Electric Company | High conductivity rotor cage for line start permanent magnet motor |
US20160055847A1 (en) * | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
CN104183237B (zh) | 2014-09-04 | 2017-10-31 | 百度在线网络技术(北京)有限公司 | 用于便携式终端的语音处理方法及装置 |
US10127911B2 (en) * | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9812126B2 (en) * | 2014-11-28 | 2017-11-07 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
CN204440902U (zh) | 2014-12-22 | 2015-07-01 | 南京声准科技有限公司 | 终端智能语音测试系统 |
EP3067884B1 (en) * | 2015-03-13 | 2019-05-08 | Samsung Electronics Co., Ltd. | Speech recognition system and speech recognition method thereof |
JP6669162B2 (ja) * | 2015-03-31 | 2020-03-18 | ソニー株式会社 | 情報処理装置、制御方法、およびプログラム |
US20190189019A1 (en) * | 2015-06-08 | 2019-06-20 | Novel Effect, Inc. | System and Method for Integrating Special Effects with a Text Source |
CN107710148B (zh) * | 2015-09-30 | 2020-02-14 | 华为技术有限公司 | 一种语音控制的处理方法和装置 |
CN106814639A (zh) * | 2015-11-27 | 2017-06-09 | 富泰华工业(深圳)有限公司 | 语音控制系统及方法 |
CN105895103B (zh) | 2015-12-03 | 2020-01-17 | 乐融致新电子科技(天津)有限公司 | 一种语音识别方法及装置 |
CN105931644B (zh) | 2016-04-15 | 2019-10-25 | Oppo广东移动通信有限公司 | 一种语音识别方法及移动终端 |
CN105869637B (zh) * | 2016-05-26 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法和装置 |
US10217453B2 (en) * | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
CN106448664A (zh) | 2016-10-28 | 2017-02-22 | 魏朝正 | 一种通过语音控制智能家居设备的系统及方法 |
CN106611597B (zh) | 2016-12-02 | 2019-11-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
US10057125B1 (en) * | 2017-04-17 | 2018-08-21 | Essential Products, Inc. | Voice-enabled home setup |
CN110444199B (zh) | 2017-05-27 | 2022-01-07 | 腾讯科技(深圳)有限公司 | 一种语音关键词识别方法、装置、终端及服务器 |
CN107564517A (zh) | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
CN107358954A (zh) | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
CN107704275B (zh) | 2017-09-04 | 2021-07-23 | 百度在线网络技术(北京)有限公司 | 智能设备唤醒方法、装置、服务器及智能设备 |
CN107610702B (zh) | 2017-09-22 | 2021-01-29 | 百度在线网络技术(北京)有限公司 | 终端设备待机唤醒方法、装置及计算机设备 |
CN107622770B (zh) | 2017-09-30 | 2021-03-16 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
-
2017
- 2017-07-05 CN CN201710543572.8A patent/CN107564517A/zh active Pending
- 2017-12-28 US US15/857,582 patent/US10964317B2/en active Active
-
2018
- 2018-03-15 JP JP2018047997A patent/JP6728540B2/ja active Active
- 2018-03-15 KR KR1020180030250A patent/KR102096156B1/ko active IP Right Grant
- 2018-03-22 EP EP18163308.2A patent/EP3447763A1/en not_active Ceased
- 2018-03-22 EP EP18212729.0A patent/EP3486901B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160180844A1 (en) * | 2014-12-19 | 2016-06-23 | Lenovo (Singapore) Pte, Ltd. | Executing a voice command during voice input |
US20170169817A1 (en) * | 2015-12-09 | 2017-06-15 | Lenovo (Singapore) Pte. Ltd. | Extending the period of voice recognition |
US20180336894A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
Also Published As
Publication number | Publication date |
---|---|
JP6728540B2 (ja) | 2020-07-22 |
EP3486901B1 (en) | 2023-06-14 |
CN107564517A (zh) | 2018-01-09 |
US10964317B2 (en) | 2021-03-30 |
KR20190005104A (ko) | 2019-01-15 |
EP3447763A1 (en) | 2019-02-27 |
US20190013021A1 (en) | 2019-01-10 |
EP3486901A1 (en) | 2019-05-22 |
JP2019015952A (ja) | 2019-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102096156B1 (ko) | 웨이크업 방법, 디바이스 및 가독매체 | |
US11955124B2 (en) | Electronic device for processing user speech and operating method therefor | |
US11636861B2 (en) | Electronic device and method of operation thereof | |
US10803862B2 (en) | Electronic device and method for processing user speech | |
US10311877B2 (en) | Performing tasks and returning audio and visual answers based on voice command | |
KR102390713B1 (ko) | 전자 장치 및 전자 장치의 통화 서비스 제공 방법 | |
CN108694947B (zh) | 语音控制方法、装置、存储介质及电子设备 | |
WO2018133307A1 (zh) | 一种实现语音控制的方法和终端 | |
KR20180047801A (ko) | 전자 장치 및 전자 장치 제어 방법 | |
WO2019114831A1 (zh) | 一种连接无线接入点的方法 | |
US9460090B2 (en) | Method of recognizing situation requiring translation and performing translation function, and electronic device implementing the same | |
US20180239754A1 (en) | Electronic device and method of providing information thereof | |
KR20190032026A (ko) | 자연어 표현 제공 방법 및 이를 지원하는 전자 장치 | |
US20190147860A1 (en) | Method and apparatus for identifying information | |
KR20190113130A (ko) | 사용자 음성 입력을 처리하는 장치 | |
US20160189709A1 (en) | Speech recognition systems and methods for maintenance repair and overhaul | |
EP3407671A1 (en) | Method and electronic device for network connection | |
CN113421565A (zh) | 搜索方法、装置、电子设备以及存储介质 | |
KR20220022282A (ko) | 주차장 기반의 공유 서비스 시스템 | |
US20220309253A1 (en) | Method for providing remote service capable of multilingual input and server performing the same | |
CN116597844A (zh) | 语音控制方法、装置、电子设备及存储介质 | |
CN115346528A (zh) | 词汇配置方法、语音交互方法、设备、存储介质及系统 | |
CN113488030A (zh) | 语音点餐方法、装置及系统 | |
CN114333766A (zh) | 语音性能测试方法、装置、系统、设备及存储介质 | |
CN114464165A (zh) | 语音服务方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |