KR20190005103A - 전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체 - Google Patents

전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체 Download PDF

Info

Publication number
KR20190005103A
KR20190005103A KR1020180030249A KR20180030249A KR20190005103A KR 20190005103 A KR20190005103 A KR 20190005103A KR 1020180030249 A KR1020180030249 A KR 1020180030249A KR 20180030249 A KR20180030249 A KR 20180030249A KR 20190005103 A KR20190005103 A KR 20190005103A
Authority
KR
South Korea
Prior art keywords
audio data
electronic device
file
wake
data files
Prior art date
Application number
KR1020180030249A
Other languages
English (en)
Inventor
롱지에 천
리펑 자오
시엔탕 창
스웨이 얜
Original Assignee
바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 filed Critical 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드
Publication of KR20190005103A publication Critical patent/KR20190005103A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3231Monitoring the presence, absence or movement of users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Abstract

본 발명은 전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체를 제공한다. 본 발명의 실시예는 전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 취득하고, 진일보 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 함으로써, 상기 전자기기의 웨이크업 응답 파일을 재생할 수 있게 하고, 선택 가능한 오디오 파일이 복수개 이므로 여러가지 제시 음성을 제공할 수 있고, 여러가지 웨이크업 제시를 제공하는 목적을 구현한다.

Description

전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체{ELECTRONIC DEVICE-AWAKENING METHOD AND APPARATUS, DEVICE AND COMPUTER-READABLE STORAGE MEDIUM}
본 발명은 웨이크업 기술에 관한 것으로서, 특히 전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체에 관한 것이다.
인공지능(Artificial Intelligence)의 영어약어는 AI이다. 이는 인간의 지능을 모의하고, 발전시키고 확장시키는 논리, 방법, 기술 및 응용 시스템을 연구 개발하는 새로운 기술과학이다. 인공지능은 컴퓨터 과학의 1개 분류이며, 지능의 실체에 대한 이해를 의도로 하고, 인류 지능과 비슷한 방식으로 반응할 수 있는 새로운 지능기기를 생산한다. 이 분야의 연구는 로봇, 언어식별, 영상식별, 자연언어처리 및 전문가 시스템 등이 있다.
최근, 음성대화 기능을 구비하는 전자 디바이스, 예를 들면, 지능 사운드 박스 등이 끊임없이 출현하고, 이는 통상 음성 웨이크업 방식으로 웨이크업시킨다. 현재의 음성 웨이크업 방식에서 단일한 제시음을 웨이크업 제시로서 제공하며, 형식이 단일이다.
본 발명의 복수 방면은 여러가지 웨이크업 제시를 제공하는 전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체를 제공한다.
본 발명의 한 방면은,
전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 취득하고,
상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하고,
상기 전자기기의 웨이크업 응답 파일을 재생하는 것을 포함하는 전자기기의 웨이크업 방법을 제공한다.
상기의 방면과 임의의 가능한 구현방식에 의하면 진일보 아래와 같은 일 구현방식을 제공한다. 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하기 전에, 진일보
적어도 1개의 제시 파일과 적어도 1개의 음성 파라미터를 획득하고,
상기 적어도 1개의 제시 파일과 상기 적어도 1개의 음성 파라미터에 근거하고, TTS기술을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성하는 것을 포함한다.
상기의 방면과 임의의 가능한 구현방식에 의하면 진일보 아래와 같은 일 구현방식을 제공한다. 상기 적어도 1개의 제시 파일과 상기 적어도 1개의 음성 파라미터에 근거하고, TTS기술을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성한 후, 진일보
상기 적어도 2개의 오디오 데이터 파일을 상기 전자 디바이스에 제공하여 상기 전자 디바이스에 저장처리시키는 것을 포함한다.
상기의 방면과 임의의 가능한 구현방식에 의하면 진일보 아래와 같은 일 구현방식을 제공한다. 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것은
상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 임의로 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것을 포함한다.
상기의 방면과 임의의 가능한 구현방식에 의하면 진일보 아래와 같은 일 구현방식을 제공한다. 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것은
상기 음성 웨이크업 지시에 근거하여 성문특징을 획득하고,
상기 성문특징에 근거하여 적어도 2개의 오디오 데이터 파일로부터 상기 사용자가 설치한 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것을 포함한다.
본 발명의 다른 한 방면은,
전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 획득하는 획득유닛;
상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 선택유닛; 및
상기 전자기기의 웨이크업 응답 파일을 재생하는 재생유닛을 포함하는 전자기기의 웨이크업 장치를 제공한다.
상기의 방면과 임의의 가능한 구현방식에 의하면 진일보 아래와 같은 일 구현방식을 제공한다. 상기 장치는, 진일보
적어도 1개의 제시 파일과 적어도 1개의 음성 파라미터를 획득하고,
상기 적어도 1개의 제시 파일과 상기 적어도 1개의 음성 파라미터에 근거하고, TTS기술을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성하는 생성유닛을 포함한다.
상기의 방면과 임의의 가능한 구현방식에 의하면 진일보 아래와 같은 일 구현방식을 제공한다. 상기 생성유닛은 진일보
상기 적어도 2개의 오디오 데이터 파일을 상기 전자 디바이스에 제공하여 상기 전자 디바이스에 저장처리시킨다.
상기의 방면과 임의의 가능한 구현방식에 의하면 진일보 아래와 같은 일 구현방식을 제공한다. 상기 선택유닛은 구체적으로,
상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 임의로 선택하여 상기 전자기기의 웨이크업 응답 파일로 한다.
상기의 방면과 임의의 가능한 구현방식에 의하면 진일보 아래와 같은 일 구현방식을 제공한다. 상기 선택유닛은 구체적으로,
상기 음성 웨이크업 지시에 근거하여 성문특징을 획득하고, 상기 성문특징에 근거하여 적어도 2개의 오디오 데이터 파일로부터 상기 사용자가 설치한 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 한다.
본 발명의 다른 한 방면은,
하나 또는 복수개의 프로세서와,
하나 또는 복수개의 프로그램을 저장하는 저장장치를 포함하는 디바이스로써,
상기 하나 또는 복수개의 프로그램이 상기 하나 또는 복수개의 프로세서에 의해 실행되면, 상기 하나 또는 복수개의 프로세서가 상기 한 방면에서 제공하는 전자기기의 방법을 구현하는 디바이스를 제공한다.
본 발명의 다른 한 방면은,
컴퓨터 프로그램을 저장하는 컴퓨터 가독 기억매체로써,
상기 프로그램이 프로세서에 의해 실행되면, 상기 한 방면에서 제공하는 전자기기의 웨이크업 방법을 구현하는 컴퓨터 가독 기억매체를 제공한다.
상기 기술안에 의하면, 본 발명의 실시예는 전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 취득하고, 진일보 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 함으로써, 상기 전자기기의 웨이크업 응답 파일을 재생할 수 있게 하고, 선택 가능한 오디오 파일이 복수개 이므로 여러가지 제시 음성을 제공할 수 있고, 여러가지 웨이크업 제시를 제공하는 목적을 구현한다.
그리고 본 발명이 제공하는 기술안을 이용하면, 성문특징을 이용하여 어느 사용자가 전자 디바이스를 웨이크업하고 있는지를 정확히 식별할 수 있고, 해당 사용자가 설치한 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 함으로써, 사용자에게 개성화한 제시음을 제공할 수 있고, 진일보 여러가지 웨이크업 제시를 제공하는 목적을 구현한다.
또한 본 발명에서 제공하는 기술안을 이용하면, 사용자의 체험을 효율적으로 향상시킬 수 있다.
본 발명의 실시예의 기술안을 보다 명료하게 설명하기 위하여 아래에서는 실시예 또는 종래의 기술 기재에 필요한 도면을 간단히 소개한다. 아래에 기재한 도면은 본 발명의 일부 실시예로써 해당 분야의 기술자라면 창조적인 노동을 하지 않는 전제하에서 이러한 도면에 의하여 다른 도면을 얻을 수 있는 것은 용이한 것이다.
도1은 본 발명에 일 실시예에서 제공하는 전자기기의 웨이크업 방법의 흐름도이다.
도2은 본 발명의 다른 일 실시예에서 제공하는 전자기기의 웨이크업 장치의 구조개략도이다.
도3은 본 발명의 다른 일 실시예에서 제공하는 전자기기의 웨이크업 장치의 구조개략도이다.
도4는 본 발명의 실시형태를 구현하기 위한 예시적인 컴퓨터 시스템/서버(12)의 블록도이다.
본 발명의 실시예의 목적, 기술안 및 우점을 보다 명확히 하기 위하여 아래에서는 본 발명의 실시예 중의 도면을 이용하여 본 발명의 실시예의 기술안을 명확하고 완전히 기술한다. 기술하는 실시예는 단지 본 발명의 일부 실시예로써 전부의 실시예가 아님을 명확히 해야 한다. 본 발명 중의 실시예에 근거하여 해당 기술분야의 기술자가 창조적인 노동을 하지 않는 전제하에서 획득하는 모든 기타 실시예는 전부 본 발명의 보호 범위에 속한다.
여기에서 본 발명의 실시예에 관련된 단말은 휴대전화, 개인정보단말(Personal Digital Assistant,PDA), 무선휴대용디바이스, 태블릿 컴퓨터(Tablet Computer), 개인 컴퓨터(Personal Computer, PC), MP3플레이어, MP4플레이어, 착용 디바이스(예를 들면, 스마트 안경, 지헤능력 손목 시계, 스마트 팔찌(Smart Bracelet)등)등을 포함할 수 있지만 이에 한정되지 않는다.
본 문에서 용어 "와/또는"은 관련대상의 관련관계를 기술할 뿐이고 예를 들면 A와/또는B는 A가 단독으로 존재하는 경우, A와 B가 동시에 존재하는 경우, B가 단독으로 존재하는 이 3가지 경우를 표시함을 이해하여야 한다. 또한 본문에서 부호 "/"는 일반적으로 전후관련대상이 "또는"의 관계임을 표시한다.
도1은 본 발명에 일 실시예에서 제공하는 전자기기의 웨이크업 방법의 흐름도이며, 도1에 나타내는 바와 같다.
101, 전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 취득한다.
102, 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 한다.
103, 상기 전자기기의 웨이크업 응답 파일을 재생한다.
여기에서, 101 이후, 사용자의 음성 웨이크업 지시를 획득한 후, 전자 디바이스는 종래의 기술에 있어서의 기술안을 이용하고, 음성 웨이크업 지시에 근거하여 관련되는 웨이크업 조작을 실행하여 동작 상태에 진입할 수 있고, 상세한 기술은 종래의 기술에 있어서의 관련 내용을 참조할 수 있다.
여기에서, 101∼103의 실행 주체의 일부 또는 전부는 전자디바이스에 있는 앱일 수도 있고, 또는 로컬 단말기에 있는 앱일 수도 있고, 로컬 단말기의 앱 중의 플러그인 또는 소프트웨어 개발킷(Software Development Kit,SDK)등 기능유닛일 수도 있고, 또는 네트워크 측 서버에 있는 조회엔진일 수도 있으며,네트워크 측에 있는 분포식 시스템일 수도 있으며, 본 실시예에서는 이를 특별히 한정하지 않는다.
상기 앱은 단말기에 설치한 네이티브 앱(nativeApp),또는 단말기상의 브라우저의 1의 웹페이지 앱(webApp)일 수도 있으며 본 실시예에서는 이를 특별히 한정하지 않는다.
이로써 전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 취득하고, 진일보 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 함으로써, 상기 전자기기의 웨이크업 응답 파일을 재생할 수 있게 하고, 선택 가능한 오디오 파일이 복수개 이므로 여러가지 제시 음성을 제공할 수 있고, 여러가지 웨이크업 제시를 제공하는 목적을 구현한다.
현재 가정용 컴퓨터, 인텔리전트 홈 기기, 텔레비전 박스 등 조작 시스템을 구비하는 시스템은 모두 시스템 휴면기능을 구비하고, 일정 조건에 달하면, 휴면상태에 들어가고, 예를 들면, 전자기기, 일부 기능을 끄고 일부 웨이크업 기능과 전원만 보류한다. 이러면 해당 전자기기의 전력이용량을 절약할 수 있는 동시에 전자기기의 손실을 저감할 수 있고, 전자기기의 수명을 연장시킬 수 있다.
바람직하게는, 본 실시예의 일 가능한 구현형태에 있어서, 101 전에 전자 디바이스는 이미 휴면상태에 있다.
바람직하게는, 본 실시예의 일 가능한 구현형태에 있어서, 101 전에 진일보 몇개의 특정한 음성지시를 설치하여 음성 웨이크업 지시로 할 수 있다. 예를 들면 "네, 시작합시다"등을 설치할 수 있다.
바람직하게는, 본 실시예의 일 가능한 구현형태에 있어서, 101에서 구체적으로, 음성수집장치를 이용하여 상기 사용자가 제공하는 음성 웨이크업 지시를 획득할 수 있다. 여기에서, 상기 음성수집장치는, 전자 디바이스에 내장 또는 외장한 마이크로폰 등일 수도 있으며 본 실시예에서는 이것을 특별히 한정하지 않는다.
바람직하게는, 본 실시예의 일 가능한 구현형태에 있어서, 102 전에 진일보 적어도 1개의 제시 파일과 적어도 1개의 음성 파라미터를 획득하면, 진일보 상기 적어도 1개의 제시 파일과 상기 적어도 1개의 음성 파라미터에 근거하고, 텍스트로부터 음성까지 (Text To Speech, TTS)의 기술을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성할 수 있다.
여기에서, 상기 음성 파라미터는, 피치 파라미터, 톤 파라미터, 음량 파라미터, 음질 파라미터, 음성 스피드 파라미터 및 음향효과 파라미터 중의 적어도 1개를 포함할 수 있고, 본 실시예에서는 이를 특별히 한정하지 않는다.
소위 음성 파라미터란, 예를 들면, 남자 소리, 여자 소리, 어린이 소리, 애니메이션 인물 소리 등 음성역할을 확정할 수 있는 관련 파라미터일 수도 있고, 본 실시예에서는 이를 특별히 한정하지 않는다.
구체적으로, 이 구현형태에서 로컬의 방식을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성할 수도 있고, 또는, 클라우드 방식을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성할 수도 있고, 본 실시예에서는 이를 특별히 한정하지 않는다.
진일보 상기 적어도 2개의 오디오 데이터 파일을 생성한 후, 진일보 상기 적어도 2개의 오디오 데이터 파일을 상기 전자 디바이스에 제공하여 상기 전자 디바이스에 저장처리시킬 수도 있다.
예를 들면, 전자 디바이스가 상기 적어도 2개의 오디오 데이터 파일을 생성한 후, 생성한 상기 적어도 2개의 오디오 데이터 파일을 음성역할에 따라 각각 전자기기의 대응되는 디렉토리에 기억할 수 있다.
또는, 예를 들면, 사용자는 전자 디바이스에 대응하는 단말상의 앱을 이용하여 자신의 흥취에 따라 상기 적어도 2개의 오디오 데이터 파일을 생성하는 것을 제어하기 위한 음성 파라미터를 제공할 수 있다. 예를 들면, 전자 디바이스에 대응하는 단말상의 앱을 이용하여 음성 파라미터를 전자 디바이스에 발송하고, 전자 디바이스에 의해 상기 적어도 2개의 오디오 데이터 파일을 생성한다. 또는 예를 들면, 전자 디바이스에 대응하는 단말상의 앱 또는 해당 앱에 대응하는 서버를 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성한다. 그 후, 생성한 상기 적어도 2개의 오디오 데이터 파일을 음성역할에 따라 각각 전자기기의 대응되는 디렉토리에 다운로드할 수 있다.
바람직하게는, 본 실시예의 일 가능한 구현형태에 있어서, 102에서 구체적으로, 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 임의로 선택하여 상기 전자기기의 웨이크업 응답 파일로 한다.
바람직하게는, 본 실시예의 일 가능한 구현형태에 있어서, 102에서 구체적으로, 상기 음성 웨이크업 지시에 근거하여 성문특징을 획득하고, 진일보 상기 성문특징에 근거하여 적어도 2개의 오디오 데이터 파일로부터 상기 사용자가 설치한 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 할 수도 있다.
소위 성문특징이란 1개의 오디오 데이터에 전속의 특징으로서, 하나의 그먼트의 오디오 데이터가 중요한 음성학 특징을 대표할 수 있는 내용에 근거하는 디지털 서명일 수 있으며, 그 주요한 목적은 유효한 구성을 구축하여 2개의 오디오 데이터의 느낌, 청각품질을 비교하는 것이다. 여기에서, 통상 큰 오디오 데이터 자체을 직접 비교하는 것이 아니라 그것에 비교하여 작은 성문특징을 비교한다.
일 구체적인 구현과정에서 상기 성문특징은 인류의 발음 구조의 해부학적 구조에 관련되는 음향학 특징, 예를 들면, 주파수 스펙트럼, 셉스트럼(cepstrum), 포먼트, 원음, 반사계수 등을 포함할 수 있으나 여기에 한정되지 않는다.
구체적으로, 상기 사용자의 음성 웨이크업 지시를 샘플링하고, 양화 및 코딩 처리를 하여 PCM데이터를 획득하여 사용자 오디오 데이터로 한다. 그 후, 상기 사용자 오디오 데이터에 대하여 프레임 분리처리를 하여 적어도 1개의 프레임 데이터를 획득하고, 진일보 적어도 1개의 프레임 데이터 중 각 프레임 데이터에 대하여 오디오 분석처리를 하여 각 레임 데이터의성문특징을 획득할 수 있다.
예를 들면, 상기 사용자 오디오 데이터에 대하여, 미리 설정한 시간간격 예를 들면 20ms에 따라 프레임 분리처리하고, 인접하는 프레임 사이에 일부 데이터가 겹치도록 하고, 예를 들면 50%의 데이터가 겹치도록 하여 상기 사용자 오디오 데이터의 적어도 하나의 프레임 데이터를 획득할 수 있다.
다른 일 구체적인 구현과정에서 102 전에 상기 사용자의 기준성문을 획득할 수 있고, 예를 들면 사용자가 제공하는 참조 음성지시를 수집하고, 해당 참조 음성 지시에 근거하여 해당 사용자의 기준성문을 획득할 수 있다.
사용자의 기준성문을 획득한 후, 그 것에 대해 저장처리할 수 있다. 구체적으로, 사용자의 기준성문을 단말의 저장 디바이스에 저장하고, 또는 전자기기의 저장 디바이스에 저장할 수 있고, 본 실시예에서는 이를 특별히 한정하지 않는다.
일 구체적인 구현과정에서 상기 저장 디바이스는 저속도 저장 디바이스일 수도 있고, 구체적으로 컴퓨터 시스템의 하드웨어일 수도 있고, 또는 단말 또는 전자 디바이스의 비운전 메모리 즉 물리적 메모리 예를 들면, 읽기전용 메모리(Read-Only Memory, ROM)와 메모리 일 수도 있지만, 본 실시예는 이것을 특별히 한정하지 않는다.
다른 일 구체적인 구현과정에서 상기 저장 디바이스는 고속도 저장 디바이스일 수도 있고, 구체적으로 컴퓨터 시스템의 메모리, 또는 단말 또는 전자 디바이스의 운전 메모리 즉 시스템 메모리 예를 들면 랜덤 엑세스 메모리(Random Access Memory, RAM) 등일 수도 있지만, 본 실시예는 이것을 특별히 한정하지 않는다.
본 실시예에서 전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 취득하고, 진일보 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 함으로써, 상기 전자기기의 웨이크업 응답 파일을 재생할 수 있게 하고, 선택 가능한 오디오 파일이 복수개 이므로 여러가지 제시 음성을 제공할 수 있고, 여러가지 웨이크업 제시를 제공하는 목적을 구현한다.
그리고 본 발명에서 제공하는 기술안을 이용하면, 성문특징을 이용하여 어느 사용자가 전자 디바이스를 웨이크업하고 있는지를 정확히 식별할 수 있고, 해당 사용자가 설치한 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 함으로써, 사용자에게 개성화한 제시음을 제공할 수 있고, 진일보 여러가지 웨이크업 제시를 제공하는 목적을 구현한다.
한편, 본 발명에서 제공하는 기술안을 이용하면, 사용자의 체험을 효율적으로 향상시킬 수 있다.
여기에서, 상기 각 방법의 실시예를 간단히 기술하기 위하여 그것을 전부 일련의 동작 조합으로서 기술했지만, 본 발명에 의하면 어떤 스텝은 다른 순서로 또는 동시에 실행할 수도 있으므로 본 분야의 당업자라면 본 발명은 여기에서 기술한 동작 순서에 한정되지 않음을 이해할 수 있다. 또한 본 분야의 당업자라면 명세서에 기재한 실시예는 전부 바람직한 실시예에 속하고, 관련된 동작 및 모듈은 본 발명에 반드시 필요한 것이 아님을 이해할 수 있다. 상기 실시예에서 각 실시예에 대한 기술은 전부 중점이 있고 어떤 실시예에서 상세하게 기술하지 않은 부분은 다른 실시예의 관련 기술을 참조할 수 있다.
도2는 본 발명의 다른 일 실시예에서 제공하는 전자기기의 웨이크업 장치의 구조개략도이며, 도2에 나타내는 바와 같다. 본 실시예의 전자기기의 웨이크업 장치는, 획득유닛(21), 선택유닛(22) 및 재생유닛(23)을 포함할 수도 있다. 여기에서 획득유닛(21)은 전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 취득하고, 선택유닛(22)은상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하고, 재생유닛(23)은 상기 전자기기의 웨이크업 응답 파일을 재생한다.
여기에서, 본 실시예에서 제공하는 전자 디바이스의 웨이크업 장치의 일부 또는 전부는 로컬 단말에 있는 앱일 수도 있고, 또는 로컬 단말에 있는 앱에 설치되어 있는 플러그인 또는 소프트웨어 개발 킷(Software Development Kit, SDK)등 기능수단일 수도 있고, 또는 네트워크 측 서버에 있는 처리엔진일 수도 있고, 또는 네트워크 측에 있는 분포식 시스템일 수도 있고, 본 실시예에서는 이를 특별히 한정하지 않는다.
상기 어플리케이션은 단말에 장착한 네이티브 어플리케이션(nativeApp)일수도 있고 또는 단말의 브라우저상의 하나의 웹페이지 어플리케이션(webApp)일수도 있고 본 실시예에서는 이를 특별히 한정하지 않는다.
바람직하게는, 본 실시예의 일 가능한 구현형태에 있어서, 도3에 나타내는 바와 같이 본 실시예에서 제공하는 전자기기의 웨이크업 장치는, 진일보 적어도 1개의 제시 파일과 적어도 1개의 음성 파라미터를 획득하고, 상기 적어도 1개의 제시 파일과 상기 적어도 1개의 음성 파라미터에 근거하고 TTS기술을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성하는 생성유닛(31)을 포함할 수도 있다.
진일보 상기 구현방식에서 상기 생성유닛(31)은 진일보 상기 적어도 2개의 오디오 데이터 파일을 상기 전자 디바이스에 제공하여 상기 전자 디바이스에 저장처리시킨다.
바람직하게는, 본 실시예의 일 가능한 구현형태에 있어서, 상기 선택유닛(22)은 구체적으로 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 임의로 선택하여 상기 전자기기의 웨이크업 응답 파일로 한다.
바람직하게는, 본 실시예의 일 가능한 구현형태에 있어서, 상기 선택유닛(22)은 구체적으로 상기 음성 웨이크업 지시에 근거하여 성문특징을 획득하고, 상기 성문특징에 근거하여 적어도 2개의 오디오 데이터 파일로부터 상기 사용자가 설치한 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 한다.
여기에서, 도1에 대응하는 실시예의 방법은 본 실시예에서 제공하는 전자기기의 웨이크업 장치로 구현된다. 상세한 기술은 도1에 대응하는 실시예 중의 관련내용을 참조할 수 있으며 여기에서는 중복하여 기술하지 않는다.
본 실시예에서 획득유닛으로 전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 취득하고, 진일보 선택유닛으로 상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하고, 상기 전자기기의 웨이크업 응답 파일로 함으로써, 재생유닛이 상기 전자기기의 웨이크업 응답 파일을 재생하도록 하고, 선택 가능한 오디오 파일이 복수개 이므로 여러가지 제시 음성을 제공할 수 있고, 여러가지 웨이크업 제시를 제공하는 목적을 구현한다.
본 발명에서 제공하는 기술안을 이용하면, 성문특징을 이용하여 어느 사용자가 전자 디바이스를 웨이크업하고 있는지를 정확히 식별할 수 있고, 해당 사용자가 설치한 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 함으로써, 사용자에게 개성화한 제시음을 제공할 수 있고, 진일보 여러가지 웨이크업 제시를 제공하는 목적을 구현한다.
본 발명에서 제공하는 기술안을 이용하면, 사용자의 체험을 효율적으로 향상시킬 수 있다.
도4는 본 발명의 실시형태를 구현하기 위한 예시적인 컴퓨터 시스템/서버(12)의 블록도이다. 도4에 표시한 컴퓨터 시스템/서버(12)은 단지 1개의 예로서 본 발명의 실시예의 기능 및 사용 범위에 어떠한 제한을 주지 않도록 해야 한다.
도4에 나타내는 바와 같이 컴퓨터 시스템/서버(12)는 통용의 계산 디바이스의 형식으로 표현된다. 컴퓨터 시스템/서버(12)의 구성 요소는 1개 또는 복수개의 프로세서 또는 처리유닛(16), 기억장치 또는 시스템 메모리(28), 다른 시스템 구성 요소(시스템 메모리(28)과 처리유닛(16))을 연결하기 위한 버스(18)을 포함할 수 있고, 이에 한정되지 않는다.
버스(18)은 복수 종류 구조 중의 하나 또는 복수 종류를 표시하고, 메모리 버스 또는 메모리 제어기, 외장 버스, 그래픽스 고속화 포트, 프로세서 또는 복수 종류의 버스 구조 중의 임의의 버스 구조의 로컬 버스 등을 포함한다. 예를 들면, 이러한 체계 구조는 공업기준체계구조(ISA)버스, 미크로 채널 아키텍처 (MAC)버스, 증강형 ISA버스, 비디오 전자기준협회(VESA) 로컬 버스 및 주변 구성요소 상호연결(PCI)버스 등을 포함할 수 있고, 이에 한정되지 않는다.
컴퓨터 시스템/서버(12)는 대표적으로 복수개의 컴퓨터 시스템 가독매체를 포함하고 있다. 이러한 매체는 컴퓨터 시스템/서버(12)에 의해 접속할 수 있는 이용가능한 임의의 매체로써 휘발성 및 비휘발성 매체와, 포터블 또는 언포터블 매체를 포함할 수도 있다.
시스템 메모리(28)은 휘발성 메모리 형식의 컴퓨터 시스템 가독매체 예를 들면, 랜덤 엑세스 메모리(RAM) (30) 및/ 또는 고속캐쉬메모리(32)를 포함할 수도 있다. 컴퓨터 시스템/서버(12)은 진일보 다른 포터블 또는 언포터블한 휘발성/비휘발성 컴퓨터 시스템 기억매체를 포함할 수도 있다. 단지 하나의 예로써 기억 시스템(34)는 언포터블한 비휘발성 자기매체(도4에 표시하지 않았지만 일반적으로 "하드웨어 드라이버"라고 불린다)에 엑세스 하는데 사용할 수도 있다. 도4에 표시하는 바와 같이 포터블한 비휘발성 자기 디스크 (예를 들면, "플로피디스크"))에 엑세스하는 자기 디스크 드라이버, 및 포터블한 비휘발성 광디스크 (예를 들면, CD-ROM, DVD-ROM 또는 기타 광매체)에 엑세스할 수 있는 광디스크 드라이버일 수도 있다. 이 경우, 각 드라이버는 1개 또는 복수개의 데이터 매체 인터페이스를 통하여 버스(18)에 접속할 수 있다. 시스템 메모리(28)은 적어도 1개의 프로그램 제품을 포함할 수도 있고, 해당 프로그램 제품은 1조 (예를 들면, 적어도 1개의)의 프로그램 모듈를 구비하고 있고, 이 프로그램 모듈은 본 발명의 각 실시예의 기능을 실행하게 배치되었다.
1조 (적어도 1개의)의 프로그램 모듈(42)의 프로그램/ 실용적인 앱(40)은 예를 들면 시스템 메모리(28)에 저장할 수 있고, 이러한 프로그램 모듈(42)은 조작 시스템, 1개 또는 복수개의 애플리케이션 프로그램, 기타 프로그램 모듈 및 프로그램 데이터를 포함할 수 있으나 이에 한정되지 않는다. 이상의 예에서 매개 또는 임의의 조합은 네트워크 환경에서의 구현을 포함하고 있다. 프로그램 모듈(42)은 일반적으로 본 발명에 기재한 실시예에 있어서의 기능 및 / 또는 방법을 실행한다.
컴퓨터 시스템/서버(12)는 1개 또는 복수개의 외부 디바이스14 (예를 들면, 키보드, 지시설비, 디스플레이(24)등)와 통신할 수 있으며, 1개 또는 복수개의 사용자가 해당 컴퓨터 시스템/서버(12)과 대화할 수 있게 하는 디바이스와 통신할 수도 있고, 및 / 또는 해당 컴퓨터 시스템/서버(12)는 1개 또는 복수개의 다른 계산 디바이스와 통신할 수 있는 임의의의 디바이스 (예를 들면, 네트워크 보드, 모뎀 등)와 통신할 수 있다. 이러한 통신은 입력/출력(I/O)인터페이스(44)을 통해 실행할 수 있다. 또한 컴퓨터 시스템/서버(12)는 네트워크 어댑터(20)로 1개 또는 복수개의 네트워크 (예를 들면, 로컬 네트워크(LAN), 광역 네트워크(WAN) 및 / 또는 공공 네트워크, 예를 들면, 인터넷)와 통신할 수 있다. 도에 나타내는 바와 같이 네트워크 어댑터(20)은 버스(18)를 통하여 컴퓨터 시스템/서버(12)의 기타 모듈과 통신한다. 도면에 포시하지 않았지만, 컴퓨터 시스템/서버(12)을 결합하여 미크로 코드, 디바이스 드라이버, 장황처리유닛, 외부 자기 디스크 드라이버 어레이, RAID시스템, 자기 테이프 드라이버 및 데이터 백업 기억 시스템 등을 포함하는 기타 하드웨어 및 / 또는 소프트웨 모듈을 이용할 수 있지만 이에 한정되지 않는다.
처리유닛(16)은 시스템 메모리(28)에 저장한 프로그램을 실행함에 따라 각 종 기능 애플리케이션 및 데이터 처리를 실행하고, 예를 들면 도1에 대응하는 실시예에서 제공하는 전자기기의 웨이크업 방법을 구현한다.
본 발명이 다른 실시예는 컴퓨터 프로그램을 저장한 컴퓨터 가독 기억매체를 제공하고, 해당 프로그램이 프로세서에 의해 실행될 때 도1에 대응하는 실시예에서 제공하는 전자기기의 웨이크업 방법을 구현한다.
구체적으로 1개 또는 복수개의 컴퓨터 가독 매체의 임의의 조합을 사용할 수 있다. 컴퓨터 가독 매체는 컴퓨터 가독 신호 매체, 또는 컴퓨터 가독 기억매체일 수도 있다. 컴퓨터 가독 기억 매체는 예를 들면 전기, 자기, 광, 전자기, 적외선, 또는 반도체 시스템, 장치 또는 디바이스, 또는 이것들의 임의의 조합일 수도 있고, 이에 한정되지 않는다. 컴퓨터 가독 기억 매체의 보다 구체적인 예(비궁극적 리스트)로서 1개 또는 복수개 도선을 포함하는 전기적 접속, 휴대폰형 컴퓨터 디스크, 하드 디스크, 랜덤 엑세스 메모리(RAM), 읽기전용 메모리(ROM), EPROM(EPROM 또는 플래시 메모리), 광섬유, 휴대식 컴팩트 디스크 읽기전용 메모리(CD-ROM), 광 기억장치, 자기 기억장치, 또는 이것들의 임의의 적절한 조합을 포함한다. 본 명세서에 있어서 컴퓨터 가독 기억 매체는 명령 실행 시스템, 장치 또는 디바이스에 의해 이용 또는 이것들과 조합하여 이용할 수 있는 프로그램을 포함하거나 또는 저장하는 임의의 유형매체일 수도 있다.
컴퓨터 가독 신호 매체는 기저 대역 또는 반송파의 일부로서 전파하는 컴퓨터 가독 프로그램 코드를 탑재한 데이터 신호를 포함할 수도 있다. 이러한 전파하는 데이터 신호는 전자기신호, 광 신호, 또는 상기의 임의의 적절한 조합을 포함하는 여러가지 형태를 취할 수 있고, 이에 한정되지 않는다. 컴퓨터 가독 신호 매체는 컴퓨터 가독 기억매체 이외의 임의의 컴퓨터 가독 매체일 수도 있고, 해당 컴퓨터 가독 매체는 명령 실행 시스템, 장치 또는 디바이스에 의해 사용되거나 또는 이것들에 결합되어서 사용되는 프로그램을 발송하고, 전파하고, 송신할 수 있다.
컴퓨터 가독 매체에 포함되는 프로그램 코드는 무선, 와이어, 케이블, RF등, 또는 이 이것들의 임의의 적절한 조합의 임의의 적당한 매체를 이용하여 송신할 수 있고, 이에 한정되지 않는다.
1개 또는 복수개의 프로그램 설계언어 또는 그 조합으로 본 발명의 동작을 실행하기 위한 컴퓨터 프로그램 코드를 편집할 수 있으며, 상기 프로그램 설계언어는 오브젝트 지향 프로그래밍 언어 예를 들면 Java, Smalltalk, C++, 및 상용의 과정식 프로그램 설계언어 예를 들면 "C" 언어 또는 유사한 프로그램 설계언어를 포함한다. 프로그램 코드는 완전히 사용자의 컴퓨터상에서 실행할 수 있고, 일부는 사용자의 컴퓨터에서 실행하여 1개의 독립적인 소프트웨어 패키지로서 실행할 수 있고, 일부는 사용자의 컴퓨터에서 일부는 원격컴퓨터상에서 실행할 수도 있고, 또는 완전히 원격 컴튜터 또는 서버에서 실행할 수도 있다. 원격컴퓨터에 관한지만 경우, 원격컴퓨터는 로컬 네트워크(LAN) 또는 광역네트워크(WAN)를 포함하는 임의의 종류의 네트워크를 통하여 사용자 컴퓨터에 접속할 수도 있고, 또는 외부 컴퓨터 (예를 들면, 인터넷 서비스 제공자를 이용하여 인터넷을 통해 접속)에 접속할 수 있다.
본 기술분야의 기술자라면 설명의 편의와 간편화를 위하여 상술한 시스템, 장치 및 유닛의 구체적인 동작과정은 상술한 방법 실시예의 대응되는 과정을 참고할 수 있음을 요해할 수 있으므로 여기에서 중복하여 설명하지 않는다.
본 발명에서 제공한 여러개의 실시예에서 공개한 시스템, 장치와 방법은 기타 방식을 통하여 구현할 수 있음을 이해할 것이다. 예를 들면, 상술한 장치의 실시예는 단지 예시적인 것이며, 예를 들면 상기 유닛의 구분은 단지 일종 론리적 기능에 대한 구분이며 실제 구현할 때 다른 구분방식을 이용할 수 있다. 예를 들면 몇개의 유닛 또는 모듈을 결합하거나 다른 하나의 시스템에 집중시키거나 일부 특징은 무시하거나 실행하지 않을 수 있다. 이 외에 표시하거나 토론하는 상호 사이의 연계 또는 직접적인 연계 또는 통신상 연결은 일부 인터페이스, 장치 또는 유닛의 간접적인 연결 또는 통신적인 연결 등 전기적, 기계적 또는 기타 방식의 연결을 통하여 구현할 수 있다.
상기 분리 부품으로 설명한 유닛은 물리상 분리한 것일 수도 있고 분리되지 않은 것일 수도 있으며, 유닛으로 표시한 부품은 물리적 유닛일 수도 있고 아닐 수도 있으며, 즉 동일한 위치에 있을 수도 있고, 복수개의 네트워크 유닛에 분포되어 있을 수도 있다. 실지 필요에 의해 그 중 일부분 또는 전부 수단을 선택하여 본 실시예의 방안 목적을 구현할 수 있다.
그리고 본 발명의 각 실시예 중의 각 기능유닛은 1의 처리유닛에 집적되어 있을 수도 있고, 각 유닛이 물리적으로 단독으로 존재할 수도 있으며, 2이상의 유닛이 1의 유닛에 집적되어 있을 수도 있다. 상기 집적된 유닛은 하드웨어의 형식으로 구현될 수도 있고, 하드웨어에 소프트웨어를 결합한 기능유닛의 형식으로 구현될 수도 있다.
상기 소프트웨어 기능유닛의 형식으로 구현한 집적된 유닛은 하나의 컴퓨터 가독 기억매체에 저장할 수 있다. 상기 소프트웨어 기능유닛은 하나의 기억매체에 저장할 수 있으며 일련의 명령을 포함하여 1의 컴퓨터설비(PC, 서버, 또는 네트워크 설비 등) 또는 프로세서(processor)로 하여금 본 발명의 각 실시예의 상술한 방법의 일부분 절차를 실행하도록 한다. 상기 기억매체는 U디스크, 포터블 하드디스크, ROM(Read-Only Memory, ROM), RAM(Random Access Memory, RAM), 디스켓 또는 광디스켓 등 각종 프로그램 코드를 저장할 수 있는 매체를 포함할 수 있다.
마지막으로 상술한 내용은 단지 본 발명의 비교적 바람직한 실시예일 뿐 본 발명을 제한하기 위함이 아니며, 상기 실시예를 참조하여 본 발명을 상세하게 설명하였으나, 본 기술분야의 기술자는 상기 각 실시예에 기재된 기술안을 수정할 수 있고, 또는 그 일부분 기술특징을 등가치환할 수 있고, 그 수정 또는 치환된 기술안의 본질은 본 발명의 각 실시예의 기술안의 주지 및 범위를 이탈하지 않는다.

Claims (12)

  1. 전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 취득하고,
    상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하고,
    상기 전자기기의 웨이크업 응답 파일을 재생하는 것을 포함하는 것을 특징으로 하는 전자기기의 웨이크업 방법.
  2. 청구항 1에 있어서,
    상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하기 전에, 진일보
    적어도 1개의 제시 파일과 적어도 1개의 음성 파라미터를 획득하고,
    상기 적어도 1개의 제시 파일과 상기 적어도 1개의 음성 파라미터에 근거하고, TTS기술을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성하는 것을 포함하는 것을 특징으로 하는 전자기기의 웨이크업 방법.
  3. 청구항 2에 있어서,
    상기 적어도 1개의 제시 파일과 상기 적어도 1개의 음성 파라미터에 근거하고, TTS기술을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성한 후, 진일보
    상기 적어도 2개의 오디오 데이터 파일을 상기 전자 디바이스에 제공하여 상기 전자 디바이스에 저장처리시키는 것을 포함하는 것을 특징으로 하는 전자기기의 웨이크업 방법.
  4. 청구항 1∼3 중 임의의 1항에 있어서,
    상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것은
    상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 임의로 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것을 포함하는 것을 특징으로 하는 전자기기의 웨이크업 방법.
  5. 청구항 1∼3 중 임의의 1항에 있어서,
    상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것은
    상기 음성 웨이크업 지시에 근거하여 성문특징을 획득하고,
    상기 성문특징에 근거하여 적어도 2개의 오디오 데이터 파일로부터 상기 사용자가 설치한 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것을 포함하는 것을 특징으로 하는 전자기기의 웨이크업 방법.
  6. 전자기기를 웨이크업 시키기 위한 사용자의 음성 웨이크업 지시를 획득하는 획득유닛;
    상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 선택유닛; 및
    상기 전자기기의 웨이크업 응답 파일을 재생하는 재생유닛을 포함하는 것을 특징으로 하는 전자기기의 웨이크업 장치.
  7. 청구항 6에 있어서,
    상기 장치는, 진일보
    적어도 1개의 제시 파일과 적어도 1개의 음성 파라미터를 획득하고, 상기 적어도 1개의 제시 파일과 상기 적어도 1개의 음성 파라미터에 근거하고, TTS기술을 이용하여 상기 적어도 2개의 오디오 데이터 파일을 생성하는 생성유닛을 포함하는 것을 특징으로 하는 전자기기의 웨이크업 장치.
  8. 청구항 7에 있어서,
    상기 생성유닛은 진일보
    상기 적어도 2개의 오디오 데이터 파일을 상기 전자 디바이스에 제공하여 상기 전자 디바이스에 저장처리시키는 것을 특징으로 하는 청구항 7에 기재된 전자기기의 웨이크업 장치.
  9. 청구항 6∼8 중 임의의 1항에 있어서,
    상기 선택유닛은 구체적으로,
    상기 음성 웨이크업 지시에 근거하여 적어도 2개의 오디오 데이터 파일로부터 1개의 오디오 데이터 파일을 임의로 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것을 특징으로 하는 청구항 6∼8의 어느 것인가의 1항에 기재된 전자기기의 웨이크업 장치.
  10. 청구항 6∼8 중 임의의 1항에 있어서,
    상기 선택유닛은 구체적으로,
    상기 음성 웨이크업 지시에 근거하여 성문특징을 획득하고,
    상기 성문특징에 근거하여 적어도 2개의 오디오 데이터 파일로부터 상기 사용자가 설치한 1개의 오디오 데이터 파일을 선택하여 상기 전자기기의 웨이크업 응답 파일로 하는 것을 특징으로 하는 전자기기의 웨이크업 장치.
  11. 하나 또는 복수개의 프로세서와,
    하나 또는 복수개의 프로그램을 저장하는 저장장치를 포함하는 디바이스로써
    상기 하나 또는 복수개의 프로그램이 상기 하나 또는 복수개의 프로세서에 의해 실행되면 상기 하나 또는 복수개의 프로세서가 청구항 1∼5 중 임의의 1항에 기재된 방법을 구현하는 것을 특징으로 하는 디바이스.
  12. 컴퓨터 프로그램을 저장하는 컴퓨터 가독 기억매체로써
    상기 프로그램이 프로세서에 의해 실행되면 청구항 1∼5 중 임의의 1항에 기재된 방법을 구현하는 것을 특징으로 하는 컴퓨터 가독 기억매체.
KR1020180030249A 2017-07-05 2018-03-15 전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체 KR20190005103A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710543516.4A CN107564532A (zh) 2017-07-05 2017-07-05 电子设备的唤醒方法、装置、设备及计算机可读存储介质
CN2017105435164 2017-07-05

Publications (1)

Publication Number Publication Date
KR20190005103A true KR20190005103A (ko) 2019-01-15

Family

ID=60973450

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180030249A KR20190005103A (ko) 2017-07-05 2018-03-15 전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체

Country Status (5)

Country Link
US (1) US10783884B2 (ko)
EP (1) EP3425630A1 (ko)
JP (1) JP2019015951A (ko)
KR (1) KR20190005103A (ko)
CN (1) CN107564532A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111916079A (zh) * 2020-08-03 2020-11-10 深圳创维-Rgb电子有限公司 一种电子设备的语音响应方法、系统、设备和存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108231079B (zh) * 2018-02-01 2021-12-07 北京百度网讯科技有限公司 用于控制电子设备的方法、装置、设备以及计算机可读存储介质
CN108495160A (zh) * 2018-02-08 2018-09-04 百度在线网络技术(北京)有限公司 智能控制方法、系统、设备及存储介质
CN109348068A (zh) * 2018-12-03 2019-02-15 咪咕数字传媒有限公司 一种信息处理方法、装置及存储介质
CN109637560A (zh) * 2018-12-19 2019-04-16 广州势必可赢网络科技有限公司 一种数据存储方法、装置和计算机可读存储介质
CN110534117B (zh) * 2019-09-10 2022-11-25 阿波罗智联(北京)科技有限公司 用于优化语音生成模型的方法、装置、设备和计算机介质
CN113593541B (zh) * 2020-04-30 2024-03-12 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备和计算机存储介质

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
US6240405B1 (en) * 1997-04-17 2001-05-29 Casio Computer Co., Ltd. Information processors having an agent function and storage mediums which contain processing programs for use in the information processor
JPH10293709A (ja) 1997-04-18 1998-11-04 Casio Comput Co Ltd 情報処理装置及び記憶媒体
US6449496B1 (en) * 1999-02-08 2002-09-10 Qualcomm Incorporated Voice recognition user interface for telephone handsets
JP2001273065A (ja) * 2000-03-23 2001-10-05 Honda Motor Co Ltd エージェント装置
JP2004096520A (ja) * 2002-09-02 2004-03-25 Hosiden Corp 音声認識リモコン
US7418392B1 (en) * 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
CA2981426A1 (en) * 2004-10-05 2006-04-05 Inago Corporation System and methods for improving accuracy of speech recognition
US8898568B2 (en) * 2008-09-09 2014-11-25 Apple Inc. Audio user interface
CN202068466U (zh) * 2011-03-31 2011-12-07 吴瑞宗 一种语音响应手机
US9329832B2 (en) * 2011-05-09 2016-05-03 Robert Allen Blaisch Voice internet system and method
CN103187051A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载互动装置
JP5902068B2 (ja) * 2012-08-22 2016-04-13 シャープ株式会社 情報処理装置およびその制御方法
CN103236259B (zh) * 2013-03-22 2016-06-29 乐金电子研发中心(上海)有限公司 语音识别处理及反馈系统、语音回复方法
EP3036594B1 (en) * 2013-08-21 2021-05-26 Ademco Inc. Devices and methods for interacting with an hvac controller
WO2015060867A1 (en) * 2013-10-25 2015-04-30 Intel Corporation Techniques for preventing voice replay attacks
US9443522B2 (en) * 2013-11-18 2016-09-13 Beijing Lenovo Software Ltd. Voice recognition method, voice controlling method, information processing method, and electronic apparatus
JP6446993B2 (ja) * 2014-10-20 2019-01-09 ヤマハ株式会社 音声制御装置およびプログラム
US9812126B2 (en) * 2014-11-28 2017-11-07 Microsoft Technology Licensing, Llc Device arbitration for listening devices
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
US10854199B2 (en) * 2016-04-22 2020-12-01 Hewlett-Packard Development Company, L.P. Communications with trigger phrases
WO2017197309A1 (en) * 2016-05-13 2017-11-16 Bose Corporation Distributed volume control for speech recognition
US10152969B2 (en) * 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10297254B2 (en) * 2016-10-03 2019-05-21 Google Llc Task initiation using long-tail voice commands by weighting strength of association of the tasks and their respective commands based on user feedback
KR20180085931A (ko) * 2017-01-20 2018-07-30 삼성전자주식회사 음성 입력 처리 방법 및 이를 지원하는 전자 장치
CN107146611B (zh) * 2017-04-10 2020-04-17 北京猎户星空科技有限公司 一种语音响应方法、装置及智能设备
US10748531B2 (en) * 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
US10521512B2 (en) * 2017-05-26 2019-12-31 Bose Corporation Dynamic text-to-speech response from a smart speaker

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111916079A (zh) * 2020-08-03 2020-11-10 深圳创维-Rgb电子有限公司 一种电子设备的语音响应方法、系统、设备和存储介质

Also Published As

Publication number Publication date
EP3425630A1 (en) 2019-01-09
JP2019015951A (ja) 2019-01-31
CN107564532A (zh) 2018-01-09
US20190013020A1 (en) 2019-01-10
US10783884B2 (en) 2020-09-22

Similar Documents

Publication Publication Date Title
KR20190005103A (ko) 전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체
US10614803B2 (en) Wake-on-voice method, terminal and storage medium
JP2021103328A (ja) 音声変換方法、装置及び電子機器
CN112863547B (zh) 虚拟资源转移处理方法、装置、存储介质及计算机设备
CN108831437B (zh) 一种歌声生成方法、装置、终端和存储介质
JP6681450B2 (ja) 情報処理方法および装置
JP2019211747A (ja) 音声接続合成の処理方法及び装置、コンピュータ設備及び読取り可能な媒体
CN108922525B (zh) 语音处理方法、装置、存储介质及电子设备
KR20200027331A (ko) 음성 합성 장치
CN111105776A (zh) 有声播放装置及其播放方法
CN112164407A (zh) 音色转换方法及装置
CN110767233A (zh) 一种语音转换系统及方法
CN112672207B (zh) 音频数据处理方法、装置、计算机设备及存储介质
CN113301372A (zh) 直播方法、装置、终端及存储介质
CN113157240A (zh) 语音处理方法、装置、设备、存储介质及计算机程序产品
CN208094741U (zh) 一种基于语音识别技术的智能麦克风
KR20200138643A (ko) 전자 기기의 음성 제어 방법, 장치, 컴퓨터 기기 및 저장 매체
CN109300472A (zh) 一种语音识别方法、装置、设备及介质
CN114708849A (zh) 语音处理方法、装置、计算机设备及计算机可读存储介质
CN113160782B (zh) 音频处理的方法、装置、电子设备及可读存储介质
CN108028055A (zh) 信息处理装置、信息处理系统和程序
CN111767083A (zh) 误唤醒音频数据的收集方法、播放设备、电子设备、介质
CN116320222B (zh) 音频处理方法、装置及存储介质
CN110289010B (zh) 一种声音采集的方法、装置、设备和计算机存储介质
JP6124844B2 (ja) サーバ、データベースを利用する方法、プログラム、システム、端末、端末プログラムおよび音声データ出力装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application