KR102096156B1 - 웨이크업 방법, 디바이스 및 가독매체 - Google Patents

웨이크업 방법, 디바이스 및 가독매체 Download PDF

Info

Publication number
KR102096156B1
KR102096156B1 KR1020180030250A KR20180030250A KR102096156B1 KR 102096156 B1 KR102096156 B1 KR 102096156B1 KR 1020180030250 A KR1020180030250 A KR 1020180030250A KR 20180030250 A KR20180030250 A KR 20180030250A KR 102096156 B1 KR102096156 B1 KR 102096156B1
Authority
KR
South Korea
Prior art keywords
request
intelligent device
wake
cloud server
user
Prior art date
Application number
KR1020180030250A
Other languages
English (en)
Other versions
KR20190005104A (ko
Inventor
시엔탕 창
리펑 자오
롱지에 천
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Publication of KR20190005104A publication Critical patent/KR20190005104A/ko
Application granted granted Critical
Publication of KR102096156B1 publication Critical patent/KR102096156B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3231Monitoring the presence, absence or movement of users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L15/222Barge in, i.e. overridable guidance for interrupting prompts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 발명은 음성웨이크업 방법, 디바이스 및 시스템, 클라우드 서버와 가독매체를 제공한다. 상기 방법은 지능 디바이스가 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제1요구를 수신하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 것을 포함한다. 본 발명의 기술방안은 지능 디바이스가 음성식별 단계에 진입한 후, 수신한 제1요구가 웨이크업 단어인 경우 해당 제1요구에 대하여 서비스 만족처리를 하지 않고, 해당 제1요구가 다시 웨이크업임을 식별할 수 있고, 명령 식별 에러를 일으키지 않고, 사용자의 기대를 만족시킬 수 있다. 본 발명의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.

Description

웨이크업 방법, 디바이스 및 가독매체{VOICE WAKEUP METHOD, APPARATUS AND READABLE MEDIUM}
본 발명은 컴퓨터 응용 기술분야에 관한 것으로서, 특히 웨이크업 방법, 지능 디바이스, 서버, 디바이스 및 가독매체에 관한 것이다.
과학기술의 발전에 따라 사용자가 지능 디바이스를 보다 편리하게 이용하게 하기 위하여 종래의 많은 지능 디바이스는 사용자의 음성입력을 서포트하고 있다.
지능 디바이스는 장기간 온라인 상태에 있으면 지능 디바이스의 소비 전력이 커지고, 수명이 짧아진다. 때문에 종래의 지능 디바이스는 동작하지 않을 때는 휴면상태로 되어 소비 전력을 절약한다. 사용자가 지능 디바이스를 이용 할 필요가 있을 때 웨이크업 단어로 지능 디바이스를 웨이크업할 수 있다. 그 후, 지능 디바이스는 음성식별 상태에 진입한다. 이 상태에서 지능 디바이스는 사용자가 입력한 음성형식의 요구를 수신하고, 클라우드 서버에 협력하여 사용자의 음성을 식별하고, 어의를 분석하고, 사용자가 요구한 서비스를 만족시킨다. 종래의 기술에서 사용자가 지능 디바이스를 웨이크업할 때 웨이크업 단어를 적어도 2번 음성입력하면 첫번째 웨이크업 단어는 지능 디바이스를 웨이크업하는데 이용함으로 식별되고, 그 후의 웨이크업 단어는 음성요구의 입력으로 식별되며, 그 때 지능 디바이스는 클라우드 서버에 협력하여 해당 웨이크업 단어에 근거하여 사용자가 요구하는 서비스를 조회한다.
따라서 종래의 웨이크업 방안에 의하면 웨이크업할 때 웨이크업 단어를 적어도 2번 입력하면 두번째 웨이크업 단어는 사용자의 음성요구로 오인되어 명령 식별 에러를 일으키고, 사용자의 기대를 만족시킬 수 없다.
본 발명은 명령 식별의 정확성을 향상시키고 사용자의 기대를 만족시키는 웨이크업 방법, 지능 디바이스, 서버, 디바이스 및 가독매체를 제공한다.
본 발명은
지능 디바이스가 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제1요구를 수신하고;
어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고;
일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는 것임을 확정하는 것을 포함하는 음성웨이크업 방법을 제공한다.
또한 바람직하게는 상기 방법에서 지능 디바이스가 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제1요구를 수신하기 전에 상기 방법은,
상기 사용자가 음성방식으로 입력한 제2요구를 수신하고;
상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하고, 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 더 포함하고;
또한 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한 후 상기 방법은,
상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 더 포함한다.
또한 바람직하게는 상기 방법에서 지능 디바이스가 음성식별 단계에 진입하는 경우, 사용자가 음성방식으로 입력한 제1요구를 수신하기 전에 상기 방법은,
상기 사용자가 음성방식으로 입력한 제2요구를 수신하고;
클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하는 것을 포함하고,
또한 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한 후 상기 방법은,
상기 클라우드 서버에 상기 지능 디바이스 표식이 첨부된 다시 웨이크업 통지 메시지를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 대응하는 상기 지능 디바이스를 확정하여 다시 웨이크업하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지하거나, 또는
상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제1요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하게 하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지시키는 것을 포함한다.
또한 바람직하게는 상기 방법에서 상기 사용자가 음성방식으로 입력한 제2요구를 수신한 후, 클라우드 서버에 상기 지능 디바이스 표식을 가지고 있는 상기 제2요구를 발송하기 전에 상기 방법은,
상기 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못한 것을 더 포함한다.
또한 바람직하게는 상기 방법에서클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송한 후, 상기 방법은,
현재 시각과 상기 클라우드 서버에 상기 제2요구를 발송하는 시각의 시간차를 획득하고;
상기 클라우드 서버가 발송한 상기 제2요구의 서비스 피드백을 수신할 때까지 상기 사용자에게 상기 시간차를 표시하고, 서비스 피드백을 수신하면 상기 시간차의 표시를 취소하고;
상기 사용자가 표시된 상기 시간차에 근거하여 상기 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 더 포함하거나,
또는, 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송한 후, 상기 방법은,
상기 제2요구를 발송한 후의 미리 설정 시간내에 상기 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고;
수신하지 않았으면 상기 사용자에게 다시 웨이크업의 제시 메시지를 표시하고;
상기 사용자가 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 더 포함한다.
본 발명은 지능 디바이스가 음성식별 단계에 진입한 후, 상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 상기 지능 디바이스가 수신한 사용자가 입력한 제1요구를 수신하고;
상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고;
어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하고;
일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 것을 포함하는 음성웨이크업 방법을 제공한다.
또한 바람직하게는 상기 방법에서 상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 제1요구를 수신하기 전에 상기 방법은,
상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 상기 지능 디바이스가 수신한 사용자가 입력한 제2요구를 수신하고;
상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 더 포함하고,
수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한 후 상기 방법은,
상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 더 포함한다.
본 발명은 상기 지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제1요구를 수신하는 수신모듈과,
어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하는 판단모듈과,
상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 확정모듈을 포함하는 지능 디바이스를 제공한다.
또한 바람직하게는 상기 지능 디바이스에서 상기 지능 디바이스는 서비스 만족처리모듈을 더 포함하고,
상기 수신모듈은 상기 사용자가 음성방식으로 입력한 제2요구를 더 수신하고,
서비스 만족처리모듈은 상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하고, 상기 제2요구에 대응하는 서비스 만족처리를 시작하고,
또한 상기 서비스 만족처리모듈은 상기 제2요구에 대응하는 서비스 만족처리를 정지한다.
또한 바람직하게는 상기 지능 디바이스에서 상기 지능 디바이스는 발송모듈을 더 포함하고,
상기 수신모듈은 상기 사용자가 음성방식으로 입력한 제2요구를 더 수신하고,
상기 발송모듈은 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하고,
또한 상기 발송모듈은 상기 클라우드 서버에 상기 지능 디바이스 표식이 첨부된 다시 웨이크업 통지 메시지를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 대응하는 상기 지능 디바이스를 확정하여 다시 웨이크업하고 상기 제2요구에 대응하는 서비스 만족처리를 정지하고,
또는, 상기 발송모듈은 상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제1요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하게 하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지한다.
또한 바람직하게는 상기 지능 디바이스에서 상기 서비스 만족처리모듈은 상기 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못한다.
또한 바람직하게는 상기 지능 디바이스는 획득모듈과 표시모듈을 더 포함하고,
상기 획득모듈은 현재 시각과 상기 클라우드 서버에 상기 제2요구를 발송하는 시각의 시간차를 획득하고,
상기 표시모듈은 상기 클라우드 서버가 발송한 상기 제2요구의 서비스 피드백을 수신할 때까지 상기 사용자에게 상기 시간차를 표시하고, 서비스 피드백을 수신하면 상기 시간차의 표시를 취소하고,
상기 수신모듈은 상기 사용자가 표시된 상기 시간차에 근거하여 상기 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 상기 웨이크업 단어를 더 수신하고, 상기 지능 디바이스를 다시 웨이크업하고,
또는, 상기 지능 디바이스는 검출모듈을 더 포함하고,
상기 검출모듈은 상기 제2요구를 발송한 후의 미리 설정 시간내에 상기 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고,
상기 표시모듈은 상기 검출모듈이 상기 제2요구후의 미리 설정한 시간길이내에 상기 클라우드 서버의 서비스 피드백을 수신하지 못한 것을 검출하면, 상기 사용자에게 다시 웨이크업의 제시 메시지를 더 표시하고,
상기 수신모듈은 상기 사용자가 음성입력한 상기 웨이크업 단어를 더 수신하고, 상기 지능 디바이스를 다시 웨이크업한다.
본 발명은,
지능 디바이스가 음성식별 단계에 진입한 후, 상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 상기 지능 디바이스가 수신한 사용자가 입력한 제1요구를 수신하는 수신모듈과,
상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하는 획득모듈과,
어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하는 판단모듈과,
상기 판단모듈이 어의해석 후의 상기 제1요구와 사전에 저장한 상기 웨이크업 단어가 일치함을 판단하면, 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 확정모듈을 포함하는 클라우드 서버를 더 제공한다.
또한 바람직하게는 상기 클라우드 서버에서,서비스 만족처리모듈을 더 포함하고,
상기 수신모듈은 상기 지능 디바이스가 발송한 상기 지능 디바이스 표식과 상기 지능 디바이스가 수신한 사용자가 입력한 제2요구를 더 수신하고,
상기 서비스 만족처리모듈은 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하고,
상기 서비스 만족처리모듈은 상기 제2요구에 대응하는 서비스 만족처리를 더 정지한다.
본 발명은 지능 디바이스와 상기 클라우드 서버를 더 포함하고, 상기 지능 디바이스는 상기 클라우드 서버와 통신연결하고, 상기 지능 디바이스는 상기 지능 디바이스를 이용하고, 상기 클라우드 서버는 상기 클라우드 서버를 이용하는 음성웨이크업 시스템을 제공한다.
본 발명은,
하나 또는 복수의 프로세서와,
하나 또는 복수의 프로그램을 저장한 메모리를 포함하는 지능 디바이스로서,
상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행되면 상기 하나 또는 복수의 프로세서가 상기 방법을 구현하는 지능 디바이스를 더 제공한다.
본 발명은,
하나 또는 복수의 프로세서와,
하나 또는 복수의 프로그램을 저장한 메모리를 포함하는 클라우드 서버로서,
상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행되면 상기 하나 또는 복수의 프로세서가 상기 방법을 구현하는 클라우드 서버를 제공한다.
본 발명은 컴퓨터 프로그램을 기억하는 컴퓨터 가독매체로서 상기 프로그램이 프로세서에 의해 실행되면 상기 방법을 구현하는 컴퓨터 가독매체를 더 제공한다.
본 발명의 음성웨이크업 방법, 지능 디바이스, 서버, 디바이스 및 가독매체는, 상기 기술방안을 이용하여 지능 디바이스가 음성식별 단계에 진입한 후, 수신한 사용자의 제1요구가 웨이크업 단어이면 해당 제1요구에 대하여 서비스 만족처리를 하지 않고, 해당 제1요구가 다시 웨이크업임을 식별할 수 있고, 명령 식별 에러를 일으키지 않고, 사용자의 기대를 만족시킬 수 있다. 본 발명의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상 시킬 수 있다.
도1은 본 발명의 음성웨이크업 방법의 실시예 1의 흐름도이다.
도2는 본 발명의 음성웨이크업 방법의 실시예 2의 흐름도이다.
도3은 본 발명의 음성웨이크업 방법의 실시예 3의 신호도이다.
도4은 본 발명의 음성웨이크업 방법의 실시예 4의 신호도이다.
도5는 본 발명의 지능 디바이스 실시예 1의 구조도이다.
도6은 본 발명의 지능 디바이스 실시예 2의 구조도이다.
도7은 본 발명의 클라우드 서버의 실시예 1의 구조도이다.
도8은 본 발명의 클라우드 서버의 실시예 2의 구조도이다.
도9은 본 발명의 음성웨이크업 시스템의 실시예의 구조도이다.
도10은 본 발명의 지능 디바이스 실시예의 구조도이다.
도11은 본 발명이 제공하는 클라우드 서버의 예시도이다.
본 발명의 실시예의 목적, 기술방안 및 우점을 보다 명확히 하기 위하여 아래에서는 도면 및 실시예를 결합하여 본 발명을 상세히 기술한다.
도1은 본 발명의 음성웨이크업 방법의 실시예 1의 흐름도이다. 도1에 나타내는 바와 같이 본 실시예의 음성웨이크업 방법은 구체적으로 이하의 절차를 포함한다.
100, 지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제1요구를 수신한다.
본 실시예의 음성웨이크업 방법의 실행 주체는 지능 디바이스로서, 예를 들면, 본 실시예의 지능 디바이스는 휴대전화, 태블릿 컴퓨터 또는, 다른 Android조작 시스템(Operating System;OS), IOS의 OS, 또는 Linux매입형OS를 인스톨한 하드웨어 디바이스일 수 있다.
본 실시예의 지능 디바이스는 이용 시 음성입력을 서포트하며, 소비 전력을 감소하기 위하여 본 실시예의 지능 디바이스는 장기간 이용하지 않을 경우 대기 상태에 있는다. 사용자는 지능 디바이스에 웨이크업 단어를 입력하여 지능 디바이스를 웨이크업할 수 있다. 그 후 지능 디바이스는 음성식별 단계에 진입한다.
예를 들면, 미리 설정 시간한계값을 설치하고, 지능 디바이스가 미리 설정 시간한계값의 시간길이내에 임의의 음성입력을 수신하지 않았으면, 그 때 지능 디바이스는 대기 단계에 진입한다. 구체적으로, 미리 설정 시간한계값은 지능 디바이스에 저장할 수도 있고, 지능 디바이스 자체로 미리 설정 시간한계값의 시간길이내에 사용자의 임의의 음성입력을 수신하지 않았는지를 검출하고, 수신하지 않았으면 대기 단계에 진입한다.
또는 지능 디바이스와 원격무선통신하는 클라우드 서버가 해당 미리 설정 시간한계값을 저장할 수도 있다. 지능 디바이스가 동작할 때, 사용자의 음성요구만을 수신하고, 그 후 사용자의 음성요구를 클라우드 서버에 발송하고, 클라우드 서버에 의해 처리한다. 지능 디바이스에 고장이 없고 네트워크가 정상일 때, 클라우드 서버가 미리 설정 시간한계값의 시간길이내에 지능 디바이스가 발송한 임의의 음성입력을 수신하지 않았으면 사용자가 미리 설정 시간한계값의 시간길이내에 지능 디바이스에 임의의 음성입력도 발송하지 않은 것을 확정할 수 있다. 이 때, 클라우드 서버는 지능 디바이스에 휴면에 진입하는 지시 메시지를 발송하고, 지능 디바이스는 수신한 지시 메시지에 근거하여 소비 전력을 저감하고, 휴면 단계에 진입할 수 있다.
지능 디바이스가 음성식별 단계에 진입한 후, 지능 디바이스는 사용자의 음성요구를 수신한 후, 단독으로 사용자의 음성요구를 처리할 수도 있고, 클라우드 서버에 협력하여 사용자의 음성요구를 처리할 수도 있고, 처리 과정은 음성식별, 어의해석 및 서비스 만족을 포함할 수 있다. 다시 말하면 먼저 사용자가 입력한 음성을 식별하고, 문자정보로 식별한 후, 식별한 문자정보를 어의해석하고, 사용자의 의도 즉 지사용자의 요구를 분석하고, 마지막으로 사용자의 요구에 대응하는 서비스를 확정하고, 사용자의 서비스를 만족시킨다. 지능 디바이스는 완전히 해제하여 상기 방식과 같이 사용자의 음성요구를 수신한 후, 직접 클라우드 서버에 발송하고, 클라우드 서버에 의해 음성식별, 어의해석 및 서비스 만족 처리를 할 수도 있다. 또는 지능 디바이스가 소정의 처리 기능을 소유하고, 소정의 서비스 정보 베이스를 저장하고 있을 수도 있으며, 음성식별, 어의해석 및 서비스 만족은 전부 지능 디바이스에서 진행할 수도 있다. 이렇게 되면, 지능 디바이스에 대한 요구가 높아지므로, 지능 디바이스만에 의해 어의식별과 어의해석을 한 후, 클라우드 서버에 의해 서비스 만족처리를 할 수 있다. 본 실시예의 서비스 만족처리는 즉 사용자에게 해당 요구를 만족시키는 서비스를 제공하는 처리 과정이다. 예를 들면, 요구는 "카메라를 기동한다"이며, "오늘의 금값", "오늘의 환율"을 조회한다.
본 실시예에서 지능 디바이스가 음성식별과 어의해석을 할 수 있는 것을 예로 한다. 또한 서비스 만족은 지능 디바이스측에서 진행할 수도 있고, 클라우드 서버측에서 진행할 수도 있다. 지능 디바이스는 웨이크업 단어를 더 수신하고 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제1요구를 수신한다. 그 후, 지능 디바이스는 해당 제1요구에 대하여 음성식별과 어의해석을 하고, 해석하고 나서 해당 제1요구에 대응하는 문자형식을 더 획득한다. 예를 들면, 사용자가 입력한 음성형식의 제1요구는 해당 지능 디바이스의 웨이크업 단어일 수도 있으며 이때 대응하는 음성식별, 어의해석 후의 제1요구는 문자형식의 웨이크업 단어일 수 있다.
101, 어의해석 후의 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 절차 102를 실행하고, 그렇지 않으면 제1요구에 대하여 서비스 만족처리한다.
102, 수신한 상기 제1요구가 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한다.
본 실시예에서 어의해석 후의 제1요구를 사전에 저장한 웨이크업 단어와 비교하고, 어의해석 후의 제1요구가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단하고, 일치하면 해당 제1요구가 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한다. 그렇지 않으면, 제1요구에 대하여 서비스 만족처리를 진행한다.
바람직하게는, 실제의 응용에서는 지능 디바이스가 수신한 모두의 제1요구를 각각 사전에 저장한 웨이크업 단어와 비교하는데 이는 처리 효율의 저하를 일으킨다. 때문에 먼저 어의해석 후의 제1요구의 문자수를 획득하고, 그 문자수가 사전에 저장한 웨이크업 단어의 문자수와 동일하면 어의해석 후의 제1요구를 사전에 저장한 웨이크업 단어와 비교하여 양자가 일치한지 여부를 판단하고, 처리 요율을 향상시킬 수 있다.
본 실시예의 음성웨이크업 방법은 지능 디바이스가 음성식별 단계에 진입하는 경우, 사용자가 음성방식으로 입력한 제1요구를 수신하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정한다. 본 실시예의 기술방안은 지능 디바이스가 음성식별 단계에 진입한 후, 수신한 제1요구가 웨이크업 단어이면 해당 제1요구에 대하여 서비스 만족처리를 하지 않고, 해당 제1요구가 다시 웨이크업임을 식별할 수 있고, 명령 식별 에러를 일으키지 않고, 사용자의 기대를 만족시킬 수 있다. 본 실시예의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
바람직하게는, 상기 도1에 표시한 실시예의 절차 100의 "지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제1요구를 수신한다" 전에, 사용자가 음성방식으로 입력한 제2요구를 더 수신하고, 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 제2요구에 대응하는 서비스를 조회하고, 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 포함한다.
지능 디바이스가 음성식별 단계에 진입한 후, 지능 디바이스는 사용자의 음성요구를 처리할 수 있다. 예를 들면, 지능 디바이스는 사용자가 음성방식으로 입력한 제2요구를 수신할 수 있다. 그 후 해당 제2요구에 대하여 음성식별, 어의해석을 진행하여 제2요구의 문자수가 웨이크업 단어의 문자수와 일치하지 않음을 확정한다. 그 후 제2요구에 대하여 서비스 만족처리를 시작한다. 구체적으로 지능 디바이스의 로컬 서비스 정보 베이스에서 해당 제2요구에 대응하는 서비스를 조회하고, 사용자에게 해당 서비스를 제공한다. 예를 들면, 사용자는 음성으로 "XXX에 전화를 걸어 주세요"를 입력하면, 이 때 지능 디바이스는 해당 요구에 대하여 음성식별과 어의해석을 한 후, 서비스 정보 베이스에서 해당 "XXX에 전화를 걸어 주세요"에 대응하는 서비스의 기동 방식을 조회하고, 그 후 사용자를 위하여 해당 서비스를 기동한다. 즉 연락처 목록에서 직접 XXX의 전화를 조회하고 전화를 건다. 지능 디바이스측의 서비스 정보 베이스에는 서비스의 명칭 예를 들면 "전화를 걸다", 서비스의 구현 형태 등의 지능 디바이스측에서 구현하는 모든 서비스 정보를 포함할 수 있다.
이 때 상응하게 절차 102에서 "수신한 제1요구가 지능 디바이스를 다시 웨이크업하는데 이용되는 것임을 확정한다" 후, 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 더 포함한다.
즉 사용자가 제2요구를 제출한 후, 지능 디바이스에 웨이크업 단어를 발송하면, 이 때 지능 디바이스는 사용자가 해당 지능 디바이스를 다시 웨이크업하는 것을 수요하는 것을 확정하고, 그 전에 구현하지 않은 서비스 만족처리는 전부 정지하고, 예를 들면, 아직 해당 제2요구의 서비스 구현 형태을 조회하고 있으면, 그 때 제2요구에 대응하는 서비스의 구현 형태을 조회하는 것을 정지하고, 현재 제2요구에 대응하는 서비스를 제공하고 있으면, 사용자에게 제2요구에 대응하는 서비스를 제공하는 것을 바로 정지한다.
바람직하게는, 본 실시예에서 지능 디바이스가 제1요구와 제2요구에 대하여 음성식별 및 어의해석을 하지 않고, 직접 클라우드 서버에 제1요구와 제2요구를 발송할 경우, 음성활성검출(Voice activity detection;VAD)을 고려하여 제1요구는 제2요구를 발송한 후 소정의 시간한계값의 뒤에 발송해야 하여 클라우드 서버가 해당 제2요구를 수신하는 것을 확보하고, 그 때 제1요구를 발송할 수 있다. 소정의 시간한계값은 실제 경험에 근거하여 선택할 수 있다.
상기 실시예에서 지능 디바이스가 음성식별, 어의분석 및 서비스 만족을 처리하는 것을 예로 하여 바람직하게는, 클라우드 서버에 의해 서비스 만족처리를 할 수도 있고, 구체적으로, 절차 100에서 "지능 디바이스가 음성식별 단계에 진입하는 경우, 사용자가 음성방식으로 입력한 제1요구를 수신한다" 전에, 사용자가 음성방식으로 입력한 제2요구를 수신하고, 클라우드 서버에 지능 디바이스 표식과 제2요구를 발송하고, 클라우드 서버에 지능 디바이스로 제2요구에 대응하는 서비스 만족처리의 실시를 개시시키는 것을 더 포함할 수도 있다.
같은 이유에 의해 지능 디바이스는 제2요구를 직접 클라우드 서버에 발송할 수도 있고, 제2요구를 음성식별 및 어의해석하고 나서 제2요구의 어의해석 후의 문자정보를 클라우드 서버에 발송할 수도 있다. 즉 본 실시예에 있어서의 서비스 만족은 클라우드 서버측에서 구현하고, 음성식별 및 어의분석은 지능 디바이스측에서 구현할 수도 있고, 물론, 실제 응용에서 음성식별 및 어의분석은 클라우드 서버측에서 구현할 수도 있다.
또한 절차 102의 "수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다"의 뒤에, 클라우드 서버에 지능 디바이스 표식을 가지고 있는 다시 웨이크업 통지 메시지를 발송하여 클라우드 서버가 지능 디바이스 표식에 근거하여 대응하는 지능 디바이스의 다시 웨이크업을 확정하도록 하고, 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 더 포함할 수도 있다.
이러한 방식에서 지능 디바이스가 음성식별 및 어의해석을 하고, 클라우드 서버가 서비스 만족처리를 구현한다. 지능 디바이스는 제1요구를 수신한 후 초보적 판단을 하여 사용자가 지능 디바이스를 다시 웨이크업하는 것을 필요로 하고 있는 것을 확정하고, 이 때 지능 디바이스는 직접 클라우드 서버에 지능 디바이스 표식을 가지고 있는 다시 웨이크업 통지 메시지를 발송한다. 따라서 클라우드 서버는 수신한 지능 디바이스 표식에 근거하여 대응하는 지능 디바이스의 다시 웨이크업을 확정하고, 제2요구에 대응하는 서비스 만족처리를 정지한다. 예를 들면, 제2요구에 대응하는 서비스의 조회를 정지하거나 또는, 지능 디바이스로 사용자에게 제2요구에 대응하는 서비스를 제공하는 것을 정지한다.
또는, 절차 102의 "수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다"의 뒤에, 클라우드 서버에 지능 디바이스 표식과 제1요구를 발송하고, 클라우드 서버에 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득시켜, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스의 다시 웨이크업에 이용되는 것임을 확정하고, 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 포함한다. 예를 들면, 제2요구에 대응하는 서비스를 정지하는 것을 포함할 수도 있고, 또는, 지능 디바이스로 사용자에게 제2요구에 대응하는 서비스를 제공하는 것을 정지하는 것을 더 포함한다.
이러한 방식과 위의 방식의 구별 점은 지능 디바이스는 자체 검출한 결과를 클라우드 서버에 발송하지 않고, 직접 클라우드 서버에 지능 디바이스 표식과 제1요구를 발송하고, 클라우드 서버에 의해 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스의 다시 웨이크업에 이용되는 것임을 확정하고, 제2요구에 대응하는 서비스 만족처리를 정지하는 것이다.
바람직하게는, 실제 응용에서 지능 디바이스와 클라우드 서버는 모두 서비스 만족을 구현할 수 있고, 지능 디바이스는 어떤 간단하고 로컬에서 구현할 수 있는 오프라인의 서비스 만족을 구현할 수 있고, 클라우드 서버는 어떤 복잡하고, 네트워크에 의해야만 구현할 수 있는 온라인 서비스 만족을 구현하는데 이용할 수 있다. 이 때 바람직하게는, 상기 실시예에서의 절차 "사용자가 음성방식으로 입력한 제2요구를 수신한다" 후, 절차 "클라우드 서버에 지능 디바이스 표식과 제2요구를 발송한다" 전에, 지능 디바이스의 로컬 서비스 정보 베이스에서 제2요구에 대응하는 서비스를 조회하지 못한 절차를 더 포함할 수도 있다. 지능 디바이스의 로컬 서비스 정보 베이스로에는 단지 로컬에서 구현할 수 있는 서비스의 명칭, 예를 들면, 사용자가 오늘 주가지수를 조회하려고 하면, 지능 디바이스의 로컬에서는 구현할 수 없으므로 이 때 "오늘 주가"의 서비스 명칭은 로컬의 서비스 정보 베이스에 저장되어 있지 않다. 그 때, 지능 디바이스의 로컬에서 해당 제2요구에 대응하는 서비스의 만족을 구현할 수 없는 경우, 클라우드 서버에 해당 제2요구를 발송하여 클라우드 서버가 해당 제2요구에 대응하는 서비스의 만족을 구현하게끔 한다. 예를 들면, 지능 디바이스의 로컬에서 어떤 오프라인의 서비스, 예를 들면 전화 걸기, 어떤 앱 열기 등을 구현할 수도 있다. 클라우드 서버에서 어떤 온라인 서비스, 예를 들면 오늘 주식시장의 주가 경향, 오늘 일기, 오늘 환율 등을 구현한다.
또한 바람직하게는, 상기 실시예의 기술방안의 기초상에서 "클라우드 서버에 지능 디바이스 표식과 제2요구를 발송한다" 후, 현재 시각과 클라우드 서버에 제2요구를 발송하는 시각의 시간차를 획득하고, 클라우드 서버가 발송한 제2요구의 서비스 피드백을 수신할 때까지 사용자에게 시간차를 표시하고, 클라우드 서버가 발송한 제2요구의 서비스 피드백을 수신하고 나서 시간차의 표시를 취소하고, 사용자가 음성입력한 사용자가 표시한 시간차에 의해 시간차가 미리 설정한 시간길이보다 긴 것을 확정했을 때에 발송한 웨이크업 단어를 수신하고, 지능 디바이스를 다시 웨이크업한다.
이러한 실시 형태에서 사용자에 의해 지능 디바이스를 다시 웨이크업하는 것을 확정하고, 그 전의 요구를 취소한다. 구체적으로, 지능 디바이스가 클라우드 서버에 요구를 발송한 때마다 1개의 타임 리코더를 기동하여 현재 시각과 클라우드 서버에 제2요구를 발송한 시각의 시간차를 카운트한다. 동시에 지능 디바이스의 디스플레이에서 사용자에게 그 시간차를 표시한다. 이렇게 하여, 사용자는 이 요구를 발송한 후 어느 정도의 시간이 지났는지를 요해할 수 있고, 지능 디바이스가 클라우드 서버가 피드백하는 이 요구에 대응하는 서비스를 수신하면, 그 때 지능 디바이스의 디스플레이상의 타임 리코더의 표시를 취소할 수 있다. 타임 리코더에 나타낸 시간차가 미리 설정한 시간길이, 예를 들면 60s보다 길고, 클라우드 서버의 임의의 서비스 피드백을 수신하지 않은 경우, 지능 디바이스의 디스플레이에 아직 점점 증가되는 시간차를 표시하면 이 때 사용자는 그 전의 요구를 취소하고, 지능 디바이스를 다시 웨이크업할 수 있다. 구체적으로, 사용자가 지능 디바이스에 웨이크업 단어를 음성입력하고, 독립적으로 조작하거나 또는 클라우드 서버에 협력하여 해당 지능 디바이스를 다시 웨이크업하는 것을 구현하고, 다시 웨이크업하기 전에 요구한 서비스 만족처리를 취소한다.
또는, 상기 실시예의 기술방안의 기초상에서 "클라우드 서버에 지능 디바이스 표식과 제2요구를 발송"한 후, 제2요구를 발송한 후의 미리 설정한 시간길이내에 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고, 수신하지 않았으면 사용자에게 다시 웨이크업의 제시 메시지를 표시하고, 사용자가 음성입력한 상기 웨이크업 단어를 수신하고, 지능 디바이스를 다시 웨이크업하는 절차를 더 포함한다.
이러한 구현 형태와 상기 구현 형태의 구별 점은 상기 구현 형태는 사용자에 의해 지능 디바이스의 다시 웨이크업을 촉발하는 것이다. 본 구현 형태에서는 지능 디바이스가 검출하고, 제2요구를 발송한 후의 미리 설정한 시간길이내에 클라우드 서버의 서비스 피드백을 수신하지 않았으면 지능 디바이스가 사용자에게 지능 디바이스를 다시 웨이크업하는 것을 제시한다. 그 후, 사용자가 웨이크업 단어를 음성입력하고, 지능 디바이스를 다시 웨이크업한다.
상기 실시예의 음성웨이크업 방법은 필요할 때 지능 단말기에 웨이크업 단어를 입력하여 다시 웨이크업하고, 음성식별로 오인하지 않으므로 명령 식별의 정확성을 보증할 수 있고, 사용자의 기대를 만족시킬 수 있다. 따라서 상기 실시예의 웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
도2는 본 발명의 음성웨이크업 방법의 실시예 2의 흐름도이다. 도2에 나타내는 바와 같이 본 실시예의 음성웨이크업 방법은 구체적으로 이하의 절차를 포함한다.
200, 지능 디바이스가 음성식별 단계에 진입한 후, 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신한 사용자가 입력한 제1요구를 수신한다.
201, 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득한다.
202, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 절차 203을 실행하고, 그렇지 않으면 제1요구에 대하여 서비스 만족처리한다.
203, 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다.
본 실시예의 음성웨이크업 방법의 실행 주체는 클라우드 서버이다. 본 실시예에서 클라우드 서버는 적어도 음성식별 단계의 서비스 만족의 구현을 제공한다. 음성식별과 어의해석은 지능 디바이스측에서 구현할 수도 있고, 클라우드 서버측에서 구현할 수도 있다. 지능 디바이스측에서 구현하면, 절차 200에서 지능 디바이스가 발송한 지능 디바이스가 이미 음성식별과 음성해석을 한 뒤(후)의 문자형식의 제1요구를 수신하고, 이 때 지능 디바이스 표식을 제1요구에 첨부할 수 있다. 음성식별과 어의해석이 클라우드 서버측에서 구현되면, 절차 200에서 수신하는 지능 디바이스가 발송한 제1요구는 음성형식일 수도 있으며, 이때 음성형식의 제1요구에 대하여 음성식별과 어의해석을 진행할 수 있다. 지능 디바이스측에서 수신한 사용자가 입력한 제1요구는 전부 음성형식이다.
본 실시예의 클라우드 서버는 무한 개의 지능 디바이스를 서포트할 수 있으므로, 지능 디바이스가 클라우드 서버에 발송한 각 메시지는 전부 해당 지능 디바이스 표식을 가지고 있어서 클라우드 서버가 어느 지능 디바이스로부터 발송했는지를 확정할 수 있도록 한다. 클라우드 서버에는 각 지능 디바이스의 웨이크업 단어가 저장되어 있고, 어떤 지능 디바이스의 요구 메서지를 접수 한 후, 요구 메시지 중의 해당 지능 디바이스 표식에 근거하여 미리 저장한 해당 지능 디바이스의 웨이크업 단어를 획득할 수 있다. 그 후, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다. 그렇지 않으면 계속하여 제1요구에 대하여 서비스 만족처리를 한다.
본 실시예의 음성웨이크업 방법은 클라우드 서버측에서 웨이크업 기능을 구현하고, 구현 원리가 상기 도1에 표시한 실시예의 기술방안에 유사하므로 상세한 것은 상기 도1에 표시한 기재를 참조할 수 있으므로 여기에서는 중복하여 기재하지 않는다.
본 실시예의 음성웨이크업 방법은 지능 디바이스가 음성식별 단계에 진입한 후, 클라우드 서버가 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신하는 사용자가 입력한 제1요구를 수신하고, 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다. 본 실시예의 기술방안은 지능 디바이스가 음성식별 단계에 진입한 후, 수신한 요구가 웨이크업 단어이면 해당 요구에 대하여 서비스 만족처리를 하지 않고, 해당 요구가 다시 웨이크업임을 식별할 수 있고, 명령 식별 에러를 일으키지 않으므로 사용자의 기대를 만족시킬 수 있으며, 본 실시예의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
또한 바람직하게는, 절차 200의 "지능 디바이스가 발송한 지능 디바이스 표식과 제1요구를 수신한다" 전에, 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신한 사용자가 입력한 제2요구를 수신하고, 지능 디바이스에서 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 더 포함할 수도 있다.
절차 203의 "수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다" 후, 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 포함할 수도 있고, 예를 들면 제2요구에 대응하는 서비스를 조회하는 것을 정지하거나, 또는 지능 디바이스로 사용자에게 제2요구에 대응하는 서비스를 제공하는 것을 정지하는 것을 더 포함할 수도 있다.
상기 절차의 구체적인 구현 형태는 상기 지능 디바이스측의 기술방안을 참조할 수 있으므로 여기에서는 중복하여 기재하지 않는다. 이상의 기재에 의하면 본 발명의 음성웨이크업 방법은 단독으로 지능 디바이스측에서 구현할 수도 있고, 지능 디바이스와 클라우드 서버의 양측에서 구현할 수도 있다. 이하에서는 양측이 결합한 것을 예로 하여 본 발명의 기술방안을 설명한다.
도3은 본 발명의 음성웨이크업 방법의 실시예 3의 신호도이다. 도3에 나타내는 바와 같이 본 실시예의 음성웨이크업 방법은 구체적으로 이하의 절차를 포함한다.
300, 지능 디바이스가 대기 상태에 있을 때, 사용자는 지능 디바이스에 웨이크업 단어를 음성입력한다.
301, 지능 디바이스는 음성형식의 웨이크업 단어에 대하여 음성식별과 어의해석을 하고, 문자형식의 웨이크업 단어를 획득하고, 사전에 저장한 웨이크업 단어를 획득하고, 수신한 웨이크업 단어가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단하여 확정하고, 지능 디바이스를 웨이크업하고, 지능 디바이스가 음성식별 단계에 진입하도록 한다.
본 실시예에서 지능 디바이스 웨이크업의 1개의 표식으로서 디스플레이가 밝아지는 것일 수도 있다.
302, 지능 디바이스는 디스플레이에서 사용자에게 "이미 음성식별 단계에 진입했습니다"를 제시한다.
303, 지능 디바이스가 음성식별 단계에 진입한 후, 사용자는 두번째로 지능 디바이스에 웨이크업 단어를 음성입력한다.
304, 지능 디바이스는 두번째로 수신한 웨이크업 단어를 음성식별 및 어의해석하고, 어의해석 후의 웨이크업 단어가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단하여 확정하고, 사용자가 지능 디바이스를 다시 웨이크업하는 것을 확정한다.
즉 사용자가 아직 지능 디바이스를 웨이크업하고 있음을 확정하고, 해당 두번째 웨이크업 단어는 음성식별의 명령으로 음성식별되지 않는다.
305, 지능 디바이스가 음성식별 단계에 진입한 후, 사용자는 지능 디바이스에 제1서비스 요구를 음성입력한다.
306, 지능 디바이스는 제1서비스 요구에 대하여 음성식별과 어의해석을 하고, 문자형식의 제1서비스 요구를 획득한다.
307, 지능 디바이스는 클라우드 서버에 지능 디바이스 표식을 가지고 있는 제1서비스 요구를 발송한다.
308, 클라우드 서버는 제1서비스 요구에 근거하여 대응하는 서비스 결과를 획득한다.
예를 들면, 사용자가 지능 디바이스로 "오늘 날씨는 어떻습니까"라는 제1서비스 요구를 발송하면, 클라우드 서버는 네트워크에 접근한다.
309, 클라우드 서버는 지능 디바이스 표식에 근거하여 지능 디바이스에 서비스 만족의 결과를 제공한다.
310, 지능 디바이스는 사용자에게 서비스 만족의 결과를 표시한다.
본 실시예에서는 지능 디바이스측에서 음성식별과 어의해석하고, 클라우드 서버에 의해 서비스 만족을 구현하는 것을 예로 하며, 바람직하게는 상기 실시예에서 지능 디바이스는 임의의 처리도 하지 않고, 완전히 해체하여 수신한 모든 음성형식의 웨이크업 단어 또는 요구만을 전부 직접 클라우드 서버에 발송하여 클라우드 서버에 의해 음성식별, 어의해석 및 서비스 만족처리를 할 수도 있으며, 여기에서는 중복하여 기재하지 않는다.
본 실시예의 음성웨이크업 방법은 상기 기술방안을 이용하여 지능 디바이스가 음성식별 단계에 진입한 후, 웨이크업 단어를 다시 수신하면, 해당 웨이크업 단어에 대하여 서비스 만족처리를 하지 않고, 해당 웨이크업 단어가 지능 디바이스의 다시 웨이크업을 지시하는 것임을 식별할 수 있고, 명령 식별 에러를 일으키지 않고, 사용자의 기대를 만족시킬 수 있다. 본 실시예의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
도4는 본 발명의 음성웨이크업 방법의 실시예 4의 신호도이다. 도4에 나타내는 바와 같이 본 실시예의 음성웨이크업 방법은 구체적으로 이하의 절차를 포함한다.
400, 지능 디바이스가 대기 상태에 있을 때, 사용자는 지능 디바이스에 웨이크업 단어를 음성입력한다.
401, 지능 디바이스는 클라우드 서버에 음성형식의 웨이크업 단어와 지능 디바이스 표식을 발송한다.
402, 클라우드 서버는 음성형식의 웨이크업 단어에 대하여 음성식별 및 어의해석하여 문자형식의 웨이크업 단어를 획득하고, 지능 디바이스 표식에 근거하여 사전에 저장한 해당 지능 디바이스에 대응하는 웨이크업 단어를 획득하고, 수신한 웨이크업 단어가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단하여 확정한다.
403, 클라우드 서버는 지능 디바이스에 웨이크업 제시를 발송하여 지능 디바이스를 음성식별 단계에 진입시킨다.
404, 지능 디바이스는 디스플레이에서 사용자에게 "이미 음성식별 단계에 진입했습니다"를 제시한다.
바람직하게는, 상기 절차 400에 따라 사용자는 웨이크업 단어를 다시 입력하고, 대응하는 절차 401-404의 처리에 의하여 사용자가 지능 디바이스를 다시 웨이크업하는 것을 확정하고, 해당 웨이크업 단어는 다른 음성명령으로 식별되지 않는다.
405, 지능 디바이스가 음성식별 단계에 진입한 후, 사용자가 지능 디바이스에 제1서비스 요구를 음성입력한다.
406, 지능 디바이스는 클라우드 서버에 음성형식의 제1서비스 요구와 지능 디바이스 표식을 발송한다.
407, 클라우드 서버는 제1서비스 요구에 대하여 서비스 만족처리한다.
408, 사용자는 지능 디바이스에 웨이크업 단어를 다시 음성입력한다.
409, 지능 디바이스는 클라우드 서버에 음성형식의 웨이크업 단어와 지능 디바이스 표식을 발송한다.
410, 클라우드 서버는 음성형식의 웨이크업 단어를 음성식별 및 어의해석하여 문자형식의 웨이크업 단어를 획득하고, 지능 디바이스 표식에 근거하여 사전에 저장한 해당 지능 디바이스에 대응하는 웨이크업 단어를 획득하고, 수신한 웨이크업 단어가 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단해 확정한다.
411, 클라우드 서버는 사용자가 지능 디바이스를 다시 웨이크업하는 것을 요구하는 것을 확정하고, 제1서비스에 대한 서비스 만족처리를 정지한다.
412, 클라우드 서버가 지능 디바이스에 다시 웨이크업 지시 메시지를 발송한다.
413, 지능 디바이스가 사용자에게 "이미 다시 웨이크업했습니다"를 표시한다.
본 실시예에서 지능 디바이스는 임의의 처리도 하지 않고, 완전히 해체하여 단지 수신한 모두의 음성형식의 웨이크업 단어 또는 요구를 전부 직접 클라우드 서버에 발송하여 클라우드 서버가 음성식별, 어의해석 및 서비스 만족처리를 한다. 바람직하게는, 지능 디바이스측에서 음성식별과 어의해석을 하고, 클라우드 서버는 단지 서비스 만족처리만을 구현할 수도 있고, 여기에서는 중복하여 기재하지 않는다.
본 실시예의 음성웨이크업 방법은 상기 기술방안을 이용하여 지능 디바이스가 음성식별 단계에 진입한 후, 제1요구에 대하여 서비스 만족처리를 한 후, 다시 웨이크업 단어를 수신하면, 해당 웨이크업 단어에 대하여 서비스 만족처리를 하지 않고 해당 웨이크업 단어는 지능 디바이스의 다시 웨이크업을 지시하는데 이용하는 것임을 식별할 수 있고, 그 전의 서비스 만족처리를 정지하고, 명령 식별 에러를 일으키지 않으므로 사용자의 기대를 만족시킬 수 있고, 본 실시예의 음성웨이크업 방안은 사용자의 요구를 효과적으로 처리할 수 있고, 사용자의 사용 체험도를 효과적으로 향상시킬 수 있다.
도5는 본 발명의 지능 디바이스 실시예 1의 구조도이다. 도5에 나타내는 바와 같이 본 실시예의 지능 디바이스는 구체적으로,
지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제1요구를 수신하는 수신모듈(10)과,
판단 어의해석 후의 수신모듈(10)이 수신한 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하는 판단모듈(11)과,
판단모듈(11)가 사전에 저장한 상기 웨이크업 단어와 일치함을 판단하면, 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정하는 확정모듈(12)을 포함한다.
본 실시예의 지능 디바이스는 상기 모듈을 이용하여 음성웨이크업 처리를 구현하는 구현 원리 및 기술효과가 상기 관련 방법의 실시예의 구현과 같으므로, 상세한 것은 상기 관련 방법의 실시예의 기재를 참조할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
도6은 본 발명의 지능 디바이스 실시예 2의 구조도이다. 도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 상기 도5에 표시한 실시예의 기술방안의 기초상에서 이하의 기술방안을 더 포함할 수 있다.
도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 서비스 만족처리모듈(13)을 더 포함할 수도 있다.
여기에서 수신모듈(10)은 상기 사용자가 음성방식으로 입력한 제2요구를 더 수신한다.
서비스 만족처리모듈(13)은 수신모듈(10)이 수신한 상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하고, 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작한다.
또한 서비스 만족처리모듈(13)은 확정모듈(12)이 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정할 때 제2요구에 대응하는 서비스 만족처리를 정지한다.
또한 바람직하게는, 도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 발송모듈(14)을 더 포함한다.
수신모듈(10)은 사용자가 음성방식으로 입력한 제2요구를 더 수신한다.
발송모듈(14)는 클라우드 서버에 지능 디바이스 표식과 수신모듈(10)이 수신한 제2요구를 발송하여 클라우드 서버가 지능 디바이스상에서 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하게 한다.
또한 발송모듈(14)은 클라우드 서버에 지능 디바이스 표식을 가지고 있는 다시 웨이크업 통지 메시지를 발송하여 클라우드 서버가 지능 디바이스 표식에 근거하여 대응하는 지능 디바이스의 다시 웨이크업을 확정하도록 하고, 제2요구에 대응하는 서비스 만족처리를 정지한다.
또는, 발송모듈(14)은 클라우드 서버에 지능 디바이스 표식과 수신모듈(10)이 수신한 제1요구를 발송하여 클라우드 서버가 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고, 일치하면 수신한 제1요구가 지능 디바이스의 다시 웨이크업에 이용되는 것임을 확정하고, 제2요구에 대응하는 서비스 만족처리를 정지한다.
또한 바람직하게는 본 실시예의 지능 디바이스에서 서비스 만족처리모듈(13)은 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못한다. 그 때에만 발송모듈(14)을 촉발하여 상기 조작을 실행한다.
또한 바람직하게는 도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 획득모듈(15)와 표시모듈(16)을 더 포함한다.
획득모듈(15)는 현재 시각과 발송모듈(14)이 클라우드 서버에 제2요구를 발송하는 시각의 시간차를 획득한다.
표시모듈(16)은 클라우드 서버가 발송한 제2요구의 서비스 피드백을 수신할 때까지 사용자에게 획득모듈(15)이 획득한 시간차를 표시하고, 서비스 피드백을 수신하면 시간차의 표시를 취소한다.
수신모듈(10)은 사용자가 표시된 시간차에 근거하여 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 웨이크업 단어를 더 수신하고, 지능 디바이스를 다시 웨이크업한다.
또는, 바람직하게는, 도6에 나타내는 바와 같이 본 실시예의 지능 디바이스는 검출모듈(17)을 더 포함한다.
검출모듈(17)은 발송모듈(14)이 제2요구를 발송한 후의 미리 설정한 시간길이내에 수신모듈(10)이 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출한다.
표시모듈(16)은 검출모듈(17)이 제2요구를 발송한 후의 미리 설정한 시간길이내에 클라우드 서버의 서비스 피드백을 수신하지 못한 것을 검출하면, 사용자에게 다시 웨이크업의 제시 메시지를 표시한다.
수신모듈(10)은 사용자가 음성입력한 웨이크업 단어를 수신하고, 지능 디바이스를 다시 웨이크업한다.
본 실시예의 지능 디바이스에 포함한 상기 모듈은 결합할 수 있는 방식으로 임의로 조합하여 본 발명의 바람직한 실시예를 형성할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
본 실시예의 지능 디바이스는 상기 모듈을 이용하여 음성웨이크업 처리를 구현하는 구현 원리 및 기술효과가 상기 관련 방법의 실시예의 구현과 같으므로, 상세한 것은 상기 관련 방법의 실시예의 기재를 참조할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
도7은 본 발명의 클라우드 서버의 실시예 1의 구조도이다. 도7에 나타내는 바와 같이 본 실시예의 클라우드 서버는 구체적으로 이하의 모듈을 포함한다.
수신모듈(20)은 지능 디바이스가 음성식별 단계에 진입한 후, 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신한 사용자가 입력한 제1요구를 수신한다.
획득모듈(21)은 수신모듈(20)이 수신한 지능 디바이스 표식에 근거하여 사전에 저장한 지능 디바이스의 웨이크업 단어를 획득한다.
판단모듈(22)는 어의해석 후의 수신모듈(20)이 수신한 제1요구가 획득모듈(21)이 획득한 사전에 저장한 웨이크업 단어와 일치한지 여부를 판단한다.
확정모듈(23)은 판단모듈(22)이 어의해석 후의 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치함을 판단하면, 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다.
본 실시예의 클라우드 서버에서, 상기 모듈을 이용하여 음성웨이크업 처리를 구현하는 구현 원리 및 기술효과가 상기 관련 방법의 실시예의 구현과 같으므로, 상세한 것은 상기 관련 방법의 실시예의 기재를 참조할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
도8은 본 발명의 클라우드 서버의 실시예 2의 구조도이다. 도8에 나타내는 바와 같이 본 실시예의 클라우드 서버는 상기 도7에 표시한 실시예의 기술방안의 기초상에서 이하의 기술방안을 더 포함할 수 있다.
도8에 나타내는 바와 같이 본 실시예의 클라우드 서버는 서비스 만족처리모듈(24)을 더 포함한다.
수신모듈(20)은 지능 디바이스가 발송한 지능 디바이스 표식과 지능 디바이스가 수신한 사용자가 입력한 제2요구를 더 수신한다.
서비스 만족처리모듈(24)은 지능 디바이스에서 수신모듈(20)이 수신한 제2요구에 대응하는 서비스 만족처리의 실시를 시작한다.
또한 서비스 만족처리모듈(24)은 확정모듈(23)이 수신한 제1요구가 지능 디바이스를 다시 웨이크업하는 것임을 확정한다. 제2요구에 대응하는 서비스 만족처리를 정지한다.
본 실시예의 클라우드 서버에서, 상기 모듈을 이용하여 음성웨이크업 처리를 구현하는 구현 원리 및 기술효과가 상기 관련 방법의 실시예의 구현과 같으므로, 상세한 것은 상기 관련 방법의 실시예의 기재를 참조할 수 있으며, 여기에서는 중복하여 기재하지 않는다.
도9는 본 발명의 음성웨이크업 시스템의 실시예의 구조도이다. 도9에 나타내는 바와 같이 본 실시예의 웨이크업 시스템은 지능 디바이스(30)과 클라우드 서버(40)을 포함한다.
본 실시예의 지능 디바이스(30)은 상기 도6에 표시한 실시예의 클라우드 서버(40)과 대화할 수 있는 지능 디바이스를 이용할 수도 있고, 본 실시예의 클라우드 서버(40)은 상기 도7 또는 도8에 표시한 실시예의 클라우드 서버를 이용할 수 있다. 또한, 구체적으로 상기 도2, 도3 또는 도4에 표시한 실시예의 음성웨이크업 방법을 이용할 수도 있고, 상세하게는 상기 관련 실시예의 기재를 참조할 수 있으므로 여기에서는 중복하여 기재하지 않는다.
도10은 본 발명의 지능 디바이스 실시예의 구조도이다. 도10에 나타내는 바와 같이 본 실시예의 지능 디바이스는 1개 또는 복수의 프로세서(30)과, 메모리(40)을 포함하고, 메모리(40)은 1개 또는 복수의 프로그램을 기억하고, 메모리(40)에 기억된 1개 또는 복수의 프로그램이 1개 또는 복수의 프로세서(30)에 의해 실행되면, 1개 또는 복수의 프로세서(30)이 상기 도1에 나타낸 실시예의 음성웨이크업 방법을 구현한다. 도10에 표시한 실시예는 복수의 프로세서(30)을 포함하고 있는 것을 예로 한다.
같은 이유에 의해, 본 실시예의 클라우드 서버는, 상기 도10에 표시한 구조를 이용할 수도 있고, 1개 또는 복수의 프로세서(30)과 메모리(10)을 포함하고, 여기에서, 메모리(40)에 기억된 1개 또는 복수의 프로그램이 1개 또는 복수의 프로세서(30)에 의하여 실행되어 1개 또는 복수의 프로세서(30)이 도2에 나타낸 실시예의 음성웨이크업 방법을 구현하게 한다.
예를 들면, 도11은 본 발명에서 제공하는 클라우드 서버의 예시도이다. 도11은 본 발명의 실시형태의 예시적인 클라우드 서버(12a)를 나타내기 위한 블록 도을 나타낸다. 도11에 표시한 클라우드 서버(12a)는 단지 1개의 예시로서 본 발명의 실시예의 기능 및 사용 범위에 임의의 제한을 주지 않는다.
도11에 나타내는 바와 같이 클라우드 서버(12a)는 통용의 계산 디바이스의 형식으로 표현된다. 클라우드 서버(12a)의 구성 요소는 1개 또는 복수의 프로세서(16a), 시스템 메모리(28a)와, 다른 시스템 구성 요소(시스템 메모리(28a)와 프로세서(16a)를 포함)을 연결하기 위한 버스(18a)를 포함할 수도 있지만 이것들에 한정되지 않는다.
버스(18a) 은 복수 종류 구조 중의 하나 또는 복수 종류를 표시하고, 메모리 버스 또는 메모리 제어기, 외장 버스, 그래픽스 고속화 포트, 프로세서 또는 복수 종류의 버스 구조 중의 임의의 버스 구조의 로컬 버스 등을 포함한다. 예를 들면, 이러한 체계 구조는 공업기준체계구조(ISA)버스, 미크로 채널 아키텍처 (MAC)버스, 증강형 ISA버스, 비디오 전자기준협회(VESA) 로컬 버스 및 주변 구성요소 상호연결(PCI)버스 등을 포함할 수 있고, 이에 한정되지 않는다.
클라우드 서버(12a) 는 대표적으로 복수개의 컴퓨터 시스템 가독매체를 포함한다. 이러한 매체는 컴퓨터 시스템/서버(12a) 에 의해 접속할 수 있는 이용가능한 임의의 매체로써 휘발성 및 비휘발성 매체와, 포터블 또는 언포터블 매체를 포함할 수도 있다.
시스템 메모리(28a) 은 휘발성 메모리 형식의 컴퓨터 시스템 가독매체 예를 들면, 랜덤 엑세스 메모리(RAM) (30a) 및/ 또는 고속캐쉬메모리(32a) 를 포함할 수도 있다. 또한 다른 포터블 또는 언포터블한 휘발성/비휘발성 컴퓨터 시스템 기억매체를 포함할 수도 있다. 단지 하나의 예로써 기억 시스템(34a)는 언포터블한 비휘발성 자기매체(도11에 표시하지 않았지만 일반적으로 "하드웨어 드라이버"라고 불린다)에 접근하는데 사용할 수도 있다. 도11에 표시하지 않았지만 포터블한 비휘발성 자기 디스크 (예를 들면, "플로피디스크"))에 엑세스하는 자기 디스크 드라이버, 및 포터블한 비휘발성 광디스크 (예를 들면, CD-ROM, DVD-ROM 또는 기타 광매체)에 접근할 수 있는 광디스크 드라이버일 수도 있다. 이 경우, 각 드라이버는 1개 또는 복수개의 데이터 매체 인터페이스를 통하여 버스(18a) 에 접속할 수 있다. 시스템 메모리(28a) 은 적어도 1개의 프로그램 제품을 포함할 수도 있고, 해당 프로그램 제품은 1조 (예를 들면, 적어도 1개의)의 프로그램 모듈를 구비하고 있고, 이 프로그램 모듈은 본 발명의 각 실시예의 기능을 실행하게 배치되었다.
한 조 (적어도 1개의)의 프로그램 모듈(42a)의 프로그램/ 실용적인 앱(40a) 은 예를 들면 시스템 메모리(28a) 에 저장할 수 있고, 이러한 프로그램 모듈(42a) 은 조작 시스템, 1개 또는 복수개의 애플리케이션 프로그램, 기타 프로그램 모듈 및 프로그램 데이터를 포함할 수 있으나 이에 한정되지 않는다. 이상의 예에서 매개 또는 임의의 조합은 네트워크 환경에서의 구현을 포함한다. 프로그램 모듈(42a) 은 일반적으로 본 발명에 기재한 실시예에 있어서의 기능 및 / 또는 방법을 실행한다.
클라우드 서버(12a) 는 1개 또는 복수개의 외부 디바이스14a(예를 들면, 키보드, 지시설비, 디스플레이(24a)등)와 통신할 수 있으며, 1개 또는 복수개의 사용자가 해당 컴퓨터 시스템/서버(12a) 과 대화할 수 있게 하는 디바이스와 통신할 수도 있고, 및 / 또는 해당 컴퓨터 시스템/서버(12a) 는 1개 또는 복수개의 다른 계산 디바이스와 통신할 수 있는 임의의의 디바이스 (예를 들면, 네트워크 보드, 모뎀 등)와 통신할 수 있다. 이러한 통신은 입력/출력(I/O)인터페이스(I/O)*j22a*j을 통해 실행할 수 있다. 또한 클라우드 서버(12a) 는 네트워크 어댑터(20a) 로 1개 또는 복수개의 네트워크 (예를 들면, 로컬 네트워크(LAN), 광역 네트워크(WAN) 및 / 또는 공공 네트워크, 예를 들면, 인터넷)와 통신할 수 있다. 도에 나타내는 바와 같이 네트워크 어댑터(20a)은 버스(18a) 를 통하여 컴퓨터 시스템/서버(12a)의 기타 모듈과 통신한다. 면에 포시하지 않았지만, 컴퓨터 시스템/서버(12a)을 결합하여 미크로 코드, 디바이스 드라이버, 장황처리유닛, 외부 자기 디스크 드라이버 어레이, RAID시스템, 자기 테이프 드라이버 및 데이터 백업 기억 시스템 등을 포함하는 기타 하드웨어 및 / 또는 소프트웨 모듈을 이용할 수 있지만 이에 한정되지 않는다.
프로세서(16a)는 시스템 메모리(28a)에 저장되어 있는 프로그램을 실행하여 여라가지 기능 앱 및 데이터 처리를 실행한다. 예를 들면, 상기 실시예에 나타낸 웨이크업 방법을 구현한다.
본 발명은 컴퓨터 프로그램을 저장한 컴퓨터 가독매체를 더 제공하고, 해당 프로그램이 프로세서에 의해 실행될 때 상기 도1에 표시한 실시예의 웨이크업 방법, 또는 도2에 나타낸 실시예의 웨이크업 방법을 구현한다.
본 실시예의 컴퓨터 가독매체는 상기 도11에 나타낸 실시예에서의 시스템 메모리(28a) 중의 RAM(30a), 및 / 또는 고속 캐쉬메모리(32a), 및 / 또는 기억 시스템(34a)를 포함할 수도 있다.
과학기술의 발전에 따라, 컴퓨터 프로그램의 전파는 유형의 매체에 한정되지 않고, 직접 네트워크에서 다운로드할 수도 있고, 또는 다른 방식으로 획득할 수도 있다. 때문에 본 실시예의 컴퓨터 가독매체는 유형의 매체를 포함할 뿐만 아니라, 무형의 매체도 포함할 수도 있다.
본 실시예의 컴퓨터 가독매체는 1개 또는 복수개의 컴퓨터 가독매체의 임의의 조합을 사용할 수 있다. 컴퓨터 가독매체는 컴퓨터 가독 신호 매체, 또는 컴퓨터 가독 기억매체일 수도 있다. 컴퓨터 가독기억매체는 예를 들면 전기, 자기, 광, 전자기, 적외선, 또는 반도체 시스템, 장치 또는 디바이스, 또는 이것들의 임의의 조합일 수도 있고, 이에 한정되지 않는다. 컴퓨터 가독 기억 매체의 보다 구체적인 예(비궁극적 리스트)로서 1개 또는 복수개 도선을 포함하는 전기적 접속, 휴대형 컴퓨터 디스크, 하드 디스크, 랜덤 엑세스 메모리(RAM), 읽기전용 메모리(ROM), EPROM(EPROM 또는 플래시 메모리), 광섬유, 휴대식 컴팩트 디스크 읽기전용 메모리(CD-ROM), 광 기억장치, 자기 기억장치, 또는 이것들의 임의의 적절한 조합을 포함한다. 본 명세서에 있어서 컴퓨터 가독 기억 매체는 명령 실행 시스템, 장치 또는 디바이스에 의해 이용 또는 이것들과 조합하여 이용할 수 있는 프로그램을 포함하거나 또는 저장하는 임의의 유형매체일 수도 있다.
컴퓨터 가독 신호 매체는 기저 대역 또는 반송파의 일부로서 전파하는 컴퓨터 가독 프로그램 코드를 탑재한 데이터 신호를 포함할 수도 있다. 이러한 전파하는데이터 신호는 전자기신호, 광 신호, 또는 상기의 임의의 적절한 조합을 포함하는 여러가지 형태를 취할 수 있고, 이에 한정되지 않는다. 컴퓨터 가독 신호 매체는 컴퓨터 가독 기억매체 이외의 임의의 컴퓨터 가독매체일 수도 있고, 해당 컴퓨터 가독매체는 명령 실행 시스템, 장치 또는 디바이스에 의해 사용되거나 또는 이것들에 결합되어서 사용되는 프로그램을 발송하고, 전파하고, 송신할 수 있다.
컴퓨터 가독매체에 포함되는 프로그램 코드는 무선, 와이어, 케이블, RF등, 또는 이 이것들의 임의의 적절한 조합의 임의의 적당한 매체를 이용하여 송신할 수 있고, 이에 한정되지 않는다.
1개 또는 복수개의 프로그램 설계언어 또는 그 조합으로 본 발명의 동작을 실행하기 위한 컴퓨터 프로그램 코드를 편집할 수 있으며, 상기 프로그램 설계언어는 오브젝트 지향 프로그래밍 언어 예를 들면 Java, Smalltalk, C++, 및 상용의 과정식 프로그램 설계언어 예를 들면 "C" 언어 또는 유사한 프로그램 설계언어를 포함한다. 프로그램 코드는 완전히 사용자의 컴퓨터상에서 실행할 수 있고, 일부는 사용자의 컴퓨터에서 실행하여 1개의 독립적인 소프트웨어 패키지로서 실행할 수 있고, 일부는 사용자의 컴퓨터에서 일부는 원격컴퓨터상에서 실행할 수도 있고, 또는 완전히 원격 컴튜터 또는 서버에서 실행할 수도 있다. 원격컴퓨터에 관한지만 경우, 원격컴퓨터는 로컬 네트워크(LAN) 또는 광역네트워크(WAN)를 포함하는 임의의 종류의 네트워크를 통하여 사용자 컴퓨터에 접속할 수도 있고, 또는 외부 컴퓨터 (예를 들면, 인터넷 서비스 제공자를 이용하여 인터넷을 통해 접속)에 접속할 수 있다.
본 발명에서 제공한 여러개의 실시예에서 공개한 시스템, 장치와 방법은 기타 방식을 통하여 구현할 수 있음을 이해할 것이다. 예를 들면, 상술한 장치의 실시예는 단지 예시적인 것이며, 예를 들면 상기 유닛의 구분은 단지 일종 론리적 기능에 대한 구분이며 실제 구현할 때 다른 구분방식을 이용할 수 있다.
상기 분리 부품으로 설명한 유닛은 물리상 분리한 것일 수도 있고 분리되지 않은 것일 수도 있으며, 유닛으로 표시한 부품은 물리적 유닛일 수도 있고 아닐 수도 있으며, 즉 동일한 위치에 있을 수도 있고, 복수개의 네트워크 유닛에 분포되어 있을 수도 있다. 실지 필요에 의해 그 중 일부분 또는 전부 수단을 선택하여 본 실시예의 방안 목적을 구현할 수 있다.
그리고 본 발명의 각 실시예 중의 각 기능유닛은 1의 처리유닛에 집적되어 있을 수도 있고, 각 유닛이 물리적으로 단독으로 존재할 수도 있으며, 2이상의 유닛이 1의 유닛에 집적되어 있을 수도 있다. 상기 집적된 유닛은 하드웨어의 형식으로 구현될 수도 있고, 하드웨어에 소프트웨어를 결합한 기능유닛의 형식으로 구현될 수도 있다.
상기 소프트웨어 기능유닛의 형식으로 구현한 집적된 유닛은 하나의 컴퓨터 가독 기억매체에 저장할 수 있다. 상기 소프트웨어 기능유닛은 하나의 기억매체에 저장할 수 있으며 일련의 명령을 포함하여 1의 컴퓨터설비(PC, 서버, 또는 네트워크 설비 등) 또는 프로세서(processor)로 하여금 본 발명의 각 실시예의 상술한 방법의 일부분 절차를 실행하도록 한다. 상기 기억매체는 U디스크, 포터블 하드디스크, ROM(Read-Only Memory, ROM), RAM(Random Access Memory, RAM), 디스켓 또는 광디스켓 등 각종 프로그램 코드를 저장할 수 있는 매체를 포함할 수 있다.
이상은 단지 본 발명의 비교적 바람직한 실시예일 뿐 본 발명을 제한하기 위함이 아니며, 본 발명의 요지와 원칙내에서 진행한 임의의 수정 또는 등가치환 및 개량 등은 전부 본 발명의 보호 범위에 포함된다.

Claims (18)

  1. 지능 디바이스가 웨이크업되어 음성식별 단계에 진입한 후, 사용자가 음성방식으로 입력한 제2요구를 수신하고, 상기 제2요구에 대응하는 서비스 만족처리를 수행하며,
    사용자가 음성방식으로 입력한 제1요구를 수신하고;
    상기 지능 디바이스가 어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하고;
    일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 포함하고,
    상기 사용자가 음성방식으로 입력한 제2요구를 수신하고, 상기 제2요구에 대응하는 서비스 만족처리를 수행하는 방법은,
    상기 사용자가 음성방식으로 입력한 제2요구를 수신하고;
    클라우드 서버에 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하는 것을 포함하고,
    상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것은,
    상기 클라우드 서버에 상기 지능 디바이스 표식이 첨부된 다시 웨이크업 통지 메시지를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 대응하는 상기 지능 디바이스를 확정하여 다시 웨이크업하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지하거나, 또는
    상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제1요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하게 하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지시키는 것을 포함하는 것을 것을 특징으로 하는 음성웨이크업 방법.
  2. 청구항 1에 있어서,
    상기 사용자가 음성방식으로 입력한 제2요구를 수신하고, 상기 제2요구에 대응하는 서비스 만족처리를 수행하는 방법은,
    상기 사용자가 음성방식으로 입력한 제2요구를 수신하고;
    상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하는 경우, 상기 제2요구에 대응하는 서비스 만족처리의 실시를 시작하는 것을 포함하는 것을 포함하는 것을 특징으로 하는 음성웨이크업 방법.
  3. 삭제
  4. 청구항 1에 있어서,
    상기 사용자가 음성방식으로 입력한 제2요구를 수신한 후, 클라우드 서버에 상기 지능 디바이스 표식을 가지고 있는 상기 제2요구를 발송하기 전에 상기 방법은,
    상기 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못하는 경우, 상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하는 것을 특징으로 하는 음성웨이크업 방법.
  5. 청구항 1에 있어서,
    클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송한 후, 상기 방법은,
    현재 시각과 상기 클라우드 서버에 상기 제2요구를 발송하는 시각의 시간차를 획득하고;
    상기 클라우드 서버가 발송한 상기 제2요구의 서비스 피드백을 수신할 때까지 상기 사용자에게 상기 시간차를 표시하고, 서비스 피드백을 수신하면 상기 시간차의 표시를 취소하고;
    상기 사용자가 표시된 상기 시간차에 근거하여 상기 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 더 포함하거나,
    또는, 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송한 후, 상기 방법은,
    상기 제2요구를 발송한 후의 미리 설정 시간내에 상기 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고;
    수신하지 않았으면 상기 사용자에게 다시 웨이크업의 제시 메시지를 표시하고;
    상기 사용자가 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 더 포함하는 것을 특징으로 하는 음성웨이크업 방법.
  6. 삭제
  7. 삭제
  8. 지능 디바이스가 음성식별 단계에 진입한 후 사용자가 음성방식으로 입력한 제2요구 및 제1요구를 수신하는 수신모듈과,
    어의해석 후의 상기 제1요구와 사전에 저장한 웨이크업 단어가 일치한지 여부를 판단하는 판단모듈과,
    상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하는 확정모듈과,
    상기 제2요구에 대응하는 서비스 만족처리를 정지하는 서비스 만족처리모듈을 포함하고,
    상기 지능 디바이스는 발송모듈을 더 포함하고,
    상기 수신모듈은 상기 사용자가 음성방식으로 입력한 제2요구를 수신하고,
    상기 발송모듈은 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하고,
    상기 발송모듈은 상기 클라우드 서버에 상기 지능 디바이스 표식이 첨부된 다시 웨이크업 통지 메시지를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 대응하는 상기 지능 디바이스를 확정하여 다시 웨이크업하고 상기 제2요구에 대응하는 서비스 만족처리를 정지하고,
    또는, 상기 발송모듈은 상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제1요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스 표식에 근거하여 사전에 저장한 상기 지능 디바이스의 웨이크업 단어를 획득하고, 어의해석 후의 상기 제1요구가 사전에 저장한 상기 웨이크업 단어와 일치한지 여부를 판단하게 하고, 일치하면 수신한 상기 제1요구가 상기 지능 디바이스를 다시 웨이크업하는데 이용하는 것임을 확정하고, 상기 제2요구에 대응하는 서비스 만족처리를 정지하는 것을 특징으로 하는 지능 디바이스.
  9. 청구항 8에 있어서,
    상기 수신모듈은 상기 사용자가 음성방식으로 입력한 제2요구를 수신하고,
    상기 서비스 만족처리모듈은 상기 제2요구에 근거하여 로컬의 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하는 경우, 상기 제2요구에 대응하는 서비스 만족처리를 시작하는 것을 특징으로 하는 지능 디바이스.
  10. 삭제
  11. 청구항 8에 있어서,
    상기 서비스 만족처리모듈은 상기 지능 디바이스의 로컬 서비스 정보 베이스에서 상기 제2요구에 대응하는 서비스를 조회하지 못하는 경우, 상기 클라우드 서버에 상기 지능 디바이스 표식과 상기 제2요구를 발송하여 상기 클라우드 서버가 상기 지능 디바이스에서 상기 제2요구에 대응하는 서비스 만족처리를 시작하게 하는 것을 특징으로 하는 지능 디바이스.
  12. 청구항 8에 있어서,
    상기 지능 디바이스는 획득모듈과 표시모듈을 더 포함하고,
    상기 획득모듈은 현재 시각과 상기 클라우드 서버에 상기 제2요구를 발송하는 시각의 시간차를 획득하고,
    상기 표시모듈은 상기 클라우드 서버가 발송한 상기 제2요구의 서비스 피드백을 수신할 때까지 상기 사용자에게 상기 시간차를 표시하고, 서비스 피드백을 수신하면 상기 시간차의 표시를 취소하고,
    상기 수신모듈은 상기 사용자가 표시된 상기 시간차에 근거하여 상기 시간차가 미리 설정한 시간길이보다 큰 것을 확정했을 때에 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하고,
    또는, 상기 지능 디바이스는 검출모듈을 더 포함하고,
    상기 검출모듈은 상기 제2요구를 발송한 후의 미리 설정 시간내에 상기 클라우드 서버의 서비스 피드백을 수신한지 여부를 검출하고,
    상기 표시모듈은 상기 검출모듈이 상기 제2요구후의 미리 설정한 시간길이내에 상기 클라우드 서버의 서비스 피드백을 수신하지 못한 것을 검출하면, 상기 사용자에게 다시 웨이크업의 제시 메시지를 표시하고,
    상기 수신모듈은 상기 사용자가 음성입력한 상기 웨이크업 단어를 수신하고, 상기 지능 디바이스를 다시 웨이크업하는 것을 특징으로 하는 지능 디바이스.
  13. 삭제
  14. 삭제
  15. 삭제
  16. 하나 또는 복수의 프로세서와,
    하나 또는 복수의 프로그램을 저장한 메모리를 포함하는 지능 디바이스로서,
    상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행되면 상기 하나 또는 복수의 프로세서가 상기 청구항 1, 2, 4, 및 5 중 임의의 1항에 기재된 방법을 구현하는 것을 특징으로 하는 지능 디바이스.
  17. 삭제
  18. 컴퓨터 프로그램을 기억하는 컴퓨터 가독매체로서,
    상기 프로그램이 프로세서에 의해 실행되면 상기 청구항 1, 2, 4, 및 5 중 임의의 1항에 기재된 방법을 구현하는 것을 특징으로 하는 컴퓨터 가독매체.
KR1020180030250A 2017-07-05 2018-03-15 웨이크업 방법, 디바이스 및 가독매체 KR102096156B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710543572.8A CN107564517A (zh) 2017-07-05 2017-07-05 语音唤醒方法、设备及系统、云端服务器与可读介质
CN2017105435728 2017-07-05

Publications (2)

Publication Number Publication Date
KR20190005104A KR20190005104A (ko) 2019-01-15
KR102096156B1 true KR102096156B1 (ko) 2020-04-06

Family

ID=60973010

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180030250A KR102096156B1 (ko) 2017-07-05 2018-03-15 웨이크업 방법, 디바이스 및 가독매체

Country Status (5)

Country Link
US (1) US10964317B2 (ko)
EP (2) EP3447763A1 (ko)
JP (1) JP6728540B2 (ko)
KR (1) KR102096156B1 (ko)
CN (1) CN107564517A (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107564517A (zh) 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 语音唤醒方法、设备及系统、云端服务器与可读介质
CN110275691A (zh) * 2018-03-15 2019-09-24 阿拉的(深圳)人工智能有限公司 智能语音唤醒的自动回复方法、装置、终端及存储介质
CN108665900B (zh) 2018-04-23 2020-03-03 百度在线网络技术(北京)有限公司 云端唤醒方法及系统、终端以及计算机可读存储介质
WO2019218368A1 (zh) * 2018-05-18 2019-11-21 深圳傲智天下信息科技有限公司 一种tws耳机、腕带式ai语音交互装置及系统
CN108735216B (zh) * 2018-06-12 2020-10-16 广东小天才科技有限公司 一种基于语义识别的语音搜题方法及家教设备
CN109377993A (zh) * 2018-10-12 2019-02-22 上海庆科信息技术有限公司 智能语音系统及其语音唤醒方法及智能语音设备
CN109389977B (zh) * 2018-11-01 2021-07-16 腾讯大地通途(北京)科技有限公司 一种语音交互方法及装置
CN109637542A (zh) * 2018-12-25 2019-04-16 圆通速递有限公司 一种语音外呼系统
US11276399B2 (en) * 2019-04-11 2022-03-15 Lg Electronics Inc. Guide robot and method for operating the same
CN111862965A (zh) * 2019-04-28 2020-10-30 阿里巴巴集团控股有限公司 唤醒处理方法、装置、智能音箱及电子设备
KR102228549B1 (ko) * 2019-06-11 2021-03-16 엘지전자 주식회사 음성 인에이블 디바이스 선택 방법, 음성 인에이블 디바이스 선택 장치 및 이를 제어하는 지능형 컴퓨팅 디바이스
CN112152890B (zh) * 2019-06-28 2022-01-21 海信视像科技股份有限公司 一种基于智能音箱的控制系统及方法
CN110706696A (zh) * 2019-09-25 2020-01-17 珠海格力电器股份有限公司 一种语音控制方法及装置
CN110890092B (zh) * 2019-11-07 2022-08-05 北京小米移动软件有限公司 唤醒控制方法及装置、计算机存储介质
CN110827799B (zh) * 2019-11-21 2022-06-10 百度在线网络技术(北京)有限公司 用于处理语音信号的方法、装置、设备和介质
CN110827820B (zh) * 2019-11-27 2022-09-27 北京梧桐车联科技有限责任公司 语音唤醒方法、装置、设备、计算机存储介质及车辆
CN111243700B (zh) * 2020-01-15 2023-09-29 创业慧康科技股份有限公司 一种电子病历输入方法及装置
CN111243577B (zh) * 2020-03-27 2022-04-19 四川虹美智能科技有限公司 语音交互方法及装置
CN111522592A (zh) * 2020-04-24 2020-08-11 腾讯科技(深圳)有限公司 一种基于人工智能的智能终端唤醒方法和装置
CN111554288A (zh) * 2020-04-27 2020-08-18 北京猎户星空科技有限公司 智能设备的唤醒方法、装置、电子设备及介质
CN111722696B (zh) * 2020-06-17 2021-11-05 思必驰科技股份有限公司 用于低功耗设备的语音数据处理方法和装置
CN111833874B (zh) * 2020-07-10 2023-12-05 上海茂声智能科技有限公司 一种基于标识符的人机交互方法、系统、设备和存储介质
KR20220037846A (ko) * 2020-09-18 2022-03-25 삼성전자주식회사 음성 인식을 수행하기 위한 전자 장치를 식별하기 위한 전자 장치 및 그 동작 방법
CN113012697A (zh) * 2021-03-05 2021-06-22 北京嘀嘀无限科技发展有限公司 一种信息交互方法、装置及电子设备
CN113921016A (zh) * 2021-10-15 2022-01-11 阿波罗智联(北京)科技有限公司 语音处理方法、装置、电子设备以及存储介质
CN114915514B (zh) * 2022-03-28 2024-03-22 青岛海尔科技有限公司 意图的处理方法和装置、存储介质及电子装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160180844A1 (en) * 2014-12-19 2016-06-23 Lenovo (Singapore) Pte, Ltd. Executing a voice command during voice input
US20170169817A1 (en) * 2015-12-09 2017-06-15 Lenovo (Singapore) Pte. Ltd. Extending the period of voice recognition
US20180336894A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000089789A (ja) 1998-09-08 2000-03-31 Fujitsu Ltd 音声認識装置及び記録媒体
US7058575B2 (en) * 2001-06-27 2006-06-06 Intel Corporation Integrating keyword spotting with graph decoder to improve the robustness of speech recognition
JP3632679B2 (ja) 2002-06-21 2005-03-23 ブラザー工業株式会社 通信システム及び通信機器
JP2004096520A (ja) 2002-09-02 2004-03-25 Hosiden Corp 音声認識リモコン
US8154227B1 (en) * 2003-11-26 2012-04-10 Liontech Trains Llc Model train control system
KR100621593B1 (ko) * 2004-09-24 2006-09-19 삼성전자주식회사 다중양식의 입력을 이용하는 통합 원격 제어 장치 및 방법
US20080147652A1 (en) * 2006-12-14 2008-06-19 Bellsouth Intellectual Property Corporation Physical address verification within electronic documents
US8041012B2 (en) 2007-03-06 2011-10-18 Embarq Holdings Company, Llc System and method for voice-activated dialing over implicit and explicit NFA trunks
US20110054899A1 (en) 2007-03-07 2011-03-03 Phillips Michael S Command and control utilizing content information in a mobile voice-to-speech application
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8090750B2 (en) * 2008-12-30 2012-01-03 International Business Machines Corporation Prompting of an end user with commands
US9421475B2 (en) * 2009-11-25 2016-08-23 Hallmark Cards Incorporated Context-based interactive plush toy
US20140372114A1 (en) * 2010-08-06 2014-12-18 Google Inc. Self-Directed Machine-Generated Transcripts
US9921803B2 (en) * 2010-08-23 2018-03-20 Nokia Technologies Oy Audio user interface apparatus and method
US9099087B2 (en) 2010-09-03 2015-08-04 Canyon IP Holdings, LLC Methods and systems for obtaining language models for transcribing communications
CN102682771B (zh) 2012-04-27 2013-11-20 厦门思德电子科技有限公司 一种适用于云平台的多语音控制方法
KR20130133629A (ko) * 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
US20140006825A1 (en) * 2012-06-30 2014-01-02 David Shenhav Systems and methods to wake up a device from a power conservation state
WO2014017144A1 (ja) 2012-07-27 2014-01-30 Jsr株式会社 ネガ型レジストパターン形成方法及びフォトレジスト組成物
US8849667B2 (en) 2012-07-31 2014-09-30 Novospeech Ltd. Method and apparatus for speech recognition
US9576574B2 (en) * 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
WO2014055076A1 (en) 2012-10-04 2014-04-10 Nuance Communications, Inc. Improved hybrid controller for asr
US10304465B2 (en) * 2012-10-30 2019-05-28 Google Technology Holdings LLC Voice control user interface for low power mode
WO2014107413A1 (en) * 2013-01-04 2014-07-10 Kopin Corporation Bifurcated speech recognition
US20140297288A1 (en) * 2013-03-29 2014-10-02 Orange Telephone voice personal assistant
CN103280217B (zh) * 2013-05-02 2016-05-04 锤子科技(北京)有限公司 一种移动终端的语音识别方法及其装置
US9786296B2 (en) 2013-07-08 2017-10-10 Qualcomm Incorporated Method and apparatus for assigning keyword model to voice operated function
US20150039316A1 (en) * 2013-07-31 2015-02-05 GM Global Technology Operations LLC Systems and methods for managing dialog context in speech systems
US9548047B2 (en) * 2013-07-31 2017-01-17 Google Technology Holdings LLC Method and apparatus for evaluating trigger phrase enrollment
EP2851808A3 (en) * 2013-09-19 2015-04-15 Maluuba Inc. Hybrid natural language processor
US9443522B2 (en) * 2013-11-18 2016-09-13 Beijing Lenovo Software Ltd. Voice recognition method, voice controlling method, information processing method, and electronic apparatus
US9373321B2 (en) * 2013-12-02 2016-06-21 Cypress Semiconductor Corporation Generation of wake-up words
US8719039B1 (en) * 2013-12-05 2014-05-06 Google Inc. Promoting voice actions to hotwords
CN103714815A (zh) 2013-12-09 2014-04-09 何永 语音控制方法及其设备
US8938394B1 (en) * 2014-01-09 2015-01-20 Google Inc. Audio triggers based on context
CN103956168A (zh) 2014-03-29 2014-07-30 深圳创维数字技术股份有限公司 一种语音识别方法、装置及终端
US9640183B2 (en) 2014-04-07 2017-05-02 Samsung Electronics Co., Ltd. Speech recognition using electronic device and server
US9953632B2 (en) * 2014-04-17 2018-04-24 Qualcomm Incorporated Keyword model generation for detecting user-defined keyword
US9620999B2 (en) * 2014-04-22 2017-04-11 Baldor Electric Company High conductivity rotor cage for line start permanent magnet motor
US20160055847A1 (en) * 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
CN104183237B (zh) 2014-09-04 2017-10-31 百度在线网络技术(北京)有限公司 用于便携式终端的语音处理方法及装置
US10127911B2 (en) * 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9812126B2 (en) * 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
CN204440902U (zh) 2014-12-22 2015-07-01 南京声准科技有限公司 终端智能语音测试系统
EP3067884B1 (en) * 2015-03-13 2019-05-08 Samsung Electronics Co., Ltd. Speech recognition system and speech recognition method thereof
JP6669162B2 (ja) * 2015-03-31 2020-03-18 ソニー株式会社 情報処理装置、制御方法、およびプログラム
US20190189019A1 (en) * 2015-06-08 2019-06-20 Novel Effect, Inc. System and Method for Integrating Special Effects with a Text Source
CN107710148B (zh) * 2015-09-30 2020-02-14 华为技术有限公司 一种语音控制的处理方法和装置
CN106814639A (zh) * 2015-11-27 2017-06-09 富泰华工业(深圳)有限公司 语音控制系统及方法
CN105895103B (zh) 2015-12-03 2020-01-17 乐融致新电子科技(天津)有限公司 一种语音识别方法及装置
CN105931644B (zh) 2016-04-15 2019-10-25 Oppo广东移动通信有限公司 一种语音识别方法及移动终端
CN105869637B (zh) * 2016-05-26 2019-10-15 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
US10217453B2 (en) * 2016-10-14 2019-02-26 Soundhound, Inc. Virtual assistant configured by selection of wake-up phrase
CN106448664A (zh) 2016-10-28 2017-02-22 魏朝正 一种通过语音控制智能家居设备的系统及方法
CN106611597B (zh) 2016-12-02 2019-11-08 百度在线网络技术(北京)有限公司 基于人工智能的语音唤醒方法和装置
US10057125B1 (en) * 2017-04-17 2018-08-21 Essential Products, Inc. Voice-enabled home setup
CN110444199B (zh) 2017-05-27 2022-01-07 腾讯科技(深圳)有限公司 一种语音关键词识别方法、装置、终端及服务器
CN107564517A (zh) 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 语音唤醒方法、设备及系统、云端服务器与可读介质
CN107358954A (zh) 2017-08-29 2017-11-17 成都启英泰伦科技有限公司 一种实时更换唤醒词的设备及方法
CN107704275B (zh) 2017-09-04 2021-07-23 百度在线网络技术(北京)有限公司 智能设备唤醒方法、装置、服务器及智能设备
CN107610702B (zh) 2017-09-22 2021-01-29 百度在线网络技术(北京)有限公司 终端设备待机唤醒方法、装置及计算机设备
CN107622770B (zh) 2017-09-30 2021-03-16 百度在线网络技术(北京)有限公司 语音唤醒方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160180844A1 (en) * 2014-12-19 2016-06-23 Lenovo (Singapore) Pte, Ltd. Executing a voice command during voice input
US20170169817A1 (en) * 2015-12-09 2017-06-15 Lenovo (Singapore) Pte. Ltd. Extending the period of voice recognition
US20180336894A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration

Also Published As

Publication number Publication date
JP6728540B2 (ja) 2020-07-22
EP3486901B1 (en) 2023-06-14
CN107564517A (zh) 2018-01-09
US10964317B2 (en) 2021-03-30
KR20190005104A (ko) 2019-01-15
EP3447763A1 (en) 2019-02-27
US20190013021A1 (en) 2019-01-10
EP3486901A1 (en) 2019-05-22
JP2019015952A (ja) 2019-01-31

Similar Documents

Publication Publication Date Title
KR102096156B1 (ko) 웨이크업 방법, 디바이스 및 가독매체
US11955124B2 (en) Electronic device for processing user speech and operating method therefor
US11636861B2 (en) Electronic device and method of operation thereof
US10803862B2 (en) Electronic device and method for processing user speech
US10311877B2 (en) Performing tasks and returning audio and visual answers based on voice command
KR102390713B1 (ko) 전자 장치 및 전자 장치의 통화 서비스 제공 방법
CN108694947B (zh) 语音控制方法、装置、存储介质及电子设备
WO2018133307A1 (zh) 一种实现语音控制的方法和终端
KR20180047801A (ko) 전자 장치 및 전자 장치 제어 방법
WO2019114831A1 (zh) 一种连接无线接入点的方法
US9460090B2 (en) Method of recognizing situation requiring translation and performing translation function, and electronic device implementing the same
US20180239754A1 (en) Electronic device and method of providing information thereof
KR20190032026A (ko) 자연어 표현 제공 방법 및 이를 지원하는 전자 장치
US20190147860A1 (en) Method and apparatus for identifying information
KR20190113130A (ko) 사용자 음성 입력을 처리하는 장치
US20160189709A1 (en) Speech recognition systems and methods for maintenance repair and overhaul
EP3407671A1 (en) Method and electronic device for network connection
CN113421565A (zh) 搜索方法、装置、电子设备以及存储介质
KR20220022282A (ko) 주차장 기반의 공유 서비스 시스템
US20220309253A1 (en) Method for providing remote service capable of multilingual input and server performing the same
CN116597844A (zh) 语音控制方法、装置、电子设备及存储介质
CN115346528A (zh) 词汇配置方法、语音交互方法、设备、存储介质及系统
CN113488030A (zh) 语音点餐方法、装置及系统
CN114333766A (zh) 语音性能测试方法、装置、系统、设备及存储介质
CN114464165A (zh) 语音服务方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant