KR20170044689A - 음성 웨이크 업 방법 및 장치 - Google Patents

음성 웨이크 업 방법 및 장치 Download PDF

Info

Publication number
KR20170044689A
KR20170044689A KR1020177007481A KR20177007481A KR20170044689A KR 20170044689 A KR20170044689 A KR 20170044689A KR 1020177007481 A KR1020177007481 A KR 1020177007481A KR 20177007481 A KR20177007481 A KR 20177007481A KR 20170044689 A KR20170044689 A KR 20170044689A
Authority
KR
South Korea
Prior art keywords
terminal
voice
switching
circuit
signal
Prior art date
Application number
KR1020177007481A
Other languages
English (en)
Other versions
KR101902717B1 (ko
Inventor
휑펭 리우
동메이 리우
Original Assignee
지티이 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지티이 코포레이션 filed Critical 지티이 코포레이션
Publication of KR20170044689A publication Critical patent/KR20170044689A/ko
Application granted granted Critical
Publication of KR101902717B1 publication Critical patent/KR101902717B1/ko

Links

Images

Classifications

    • H04M1/72519
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0209Power saving arrangements in terminal devices
    • H04W52/0251Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity
    • H04W52/0254Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity detecting a user operation or a tactile contact or a motion of the device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3228Monitoring task completion, e.g. by use of idle timers, stop commands or wait commands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0209Power saving arrangements in terminal devices
    • H04W52/0261Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level
    • H04W52/0274Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level by switching on or off the equipment or parts thereof
    • H04W52/028Power saving arrangements in terminal devices managing power supply demand, e.g. depending on battery level by switching on or off the equipment or parts thereof switching on or off only a part of the equipment circuit blocks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/34Microprocessors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02BCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
    • Y02B70/00Technologies for an efficient end-user side electric power management and consumption
    • Y02B70/30Systems integrating technologies related to power network operation and communication or information technologies for improving the carbon footprint of the management of residential or tertiary loads, i.e. smart grids as climate change mitigation technology in the buildings sector, including also the last stages of power distribution and the control, monitoring or operating management systems at local level
    • Y02B70/3225Demand response systems, e.g. load shedding, peak shaving
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S20/00Management or operation of end-user stationary applications or the last stages of power distribution; Controlling, monitoring or operating thereof
    • Y04S20/20End-user application control systems
    • Y04S20/222Demand response systems, e.g. load shedding, peak shaving

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephone Function (AREA)
  • Power Engineering (AREA)

Abstract

본 발명은 단말기를 개시하며, 상기 단말기는 마이크로폰, 전원 전환 제어회로, 데이터 전환 제어회로, 음성 웨이크 업 회로, 및 음성 웨이크 업 공급 전원을 포함하는 바, 상기 마이크로폰은 음성 신호를 수집하여 상기 음성 신호를 상기 데이터 전환 제어회로에 입력하도록 구성되며; 상기 전원 전환 제어회로는 음성 웨이크 업 명령을 수신하였을 경우 상기 음성 웨이크 업 공급 전원을 통해 상기 마이크로폰에 전원 공급하도록 구성되며; 상기 데이터 전환 제어회로는 음성 웨이크 업 명령을 수신하였을 경우 상기 음성 신호를 음성 웨이크 업 회로에 입력하도록 구성되며; 상기 음성 웨이크 업 회로는 입력된 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 이에 상응하는 조작을 수행하도록 구성된다. 본 발명은 동시에 음성 웨이크 업 방법을 개시한다.

Description

음성 웨이크 업 방법 및 장치{VOICE WAKE-UP METHOD AND DEVICE}
본 발명은 회로 디자인 분야의 음성 신호 처리 기술에 관한 것으로서, 특히 음성 웨이크 업 방법 및 장치에 관한 것이다.
과학기술이 발전함에 따라 이동단말기에서의 애플리케이션도 점점 광범위해지는 데, 예를 들면 이동단말기에서의 보수계 애플리케이션, 네비게이션 애플리케이션, 건강 모니터링 애플리케이션, 음성 웨이크 업 애플리케이션 등을 들수 있다. 여기서 음성 웨이크 업 애플리케이션은 최근 업계 주목을 받고 있는 핫 스폿으로 되고 있다. 종래의 음성 웨이크 업 기술에서 일반적으로 독립된 음성 인식 하드웨어 시스템과 독립된 음성 인식 소프트웨어 시스템을 사용하고 있다.
발명자는 본 발명을 구현하는 과정에서 종래의 음성 웨이크 업 기술에 적어도 하기와 같은 결점이 존재함을 발견하였다.
종래의 음성 웨이크 업 기술에서는 전문적으로 마이크로폰을 추가하여 음성 웨이크 업 신호에 대한 수집을 완료하며 또한 전문적으로 추가된 마이크로폰을 위해 오디오 회로 디자인, 구조 디자인, 신원식별자(ID) 디자인을 필요로 함으로써, 단말기의 디자인이 상대적으로 복잡해지고 제조원가가 높아진다.
이를 감안하여, 본 발명의 적어도 하나의 실시예의 목적은 간단한 회로구조를 가지는 동시에 음성 웨이크 업을 구현할 수 있으며 또한 원가가 비교적 저가인 음성 웨이크 업 방법 및 장치를 제공하는 데 있다.
상술한 목적을 달성하기 위해, 본 발명의 기술안은 하기와 같이 구현된다.
본 발명의 실시예에서는 단말기를 제공하며, 상기 단말기는, 마이크로폰, 전원 전환 제어회로, 데이터 전환 제어회로, 음성 웨이크 업 회로, 및 음성 웨이크 업 공급 전원을 포함하며,
상기 마이크로폰은 음성 신호를 수집하여 상기 음성 신호를 상기 데이터 전환 제어회로에 입력하도록 구성되며;
상기 전원 전환 제어회로는 음성 웨이크 업 명령을 수신하였을 경우 상기 음성 웨이크 업 공급 전원을 통해 상기 마이크로폰에 전원 공급하도록 구성되며;
상기 데이터 전환 제어회로는 음성 웨이크 업 명령을 수신하였을 경우 상기 음성 신호를 음성 웨이크 업 회로에 입력하도록 구성되며;
상기 음성 웨이크 업 회로는 입력된 음성 신호에 대하여 사전 처리(pre-processing) 및 매칭을 진행하여 매칭 결과에 따라 이에 상응하는 조작을 수행하도록 구성된다.
상술한 기술안에 있어서, 상기 음성 웨이크 업 회로는,
입력된 음성 신호에 대하여 사전 처리를 진행한 후 음성 웨이크 업 매칭회로에 입력하도록 구성되는 음성 웨이크 업 사전 처리회로; 및
사전 처리를 진행한 음성 신호에 대하여 매칭을 진행하여 매칭결과에 따라 이에 상응하는 조작을 수행하도록 구성되는 음성 웨이크 업 매칭회로를 포함한다.
상술한 기술안에 있어서, 상기 단말기는 단말기 마스터 제어 처리회로 및 단말기 마스터 제어 공급 전원을 더 포함하며,
상기 전원 전환 제어회로는 음성 정상 작업 명령을 수신하였을 경우 상기 단말기 마스터 제어 공급 전원을 통해 상기 마이크로폰으로 전원 공급하도록 더 구성되며,
상기 데이터 전환 제어회로는 음성 정상 작업 명령을 수신하였을 경우 상기 음성 신호를 상기 단말기 마스터 제어 처리회로에 입력하도록 더 구성되며,
상기 단말기 마스터 제어 처리회로는 입력된 음성 신호에 대하여 상응하는 처리를 진행하여 음성 정상 작업을 완료하도록 구성된다.
상술한 기술안에 있어서, 상기 전원 전환 제어회로는 제1 스위칭회로를 이용하여 구현되며, 상기 제1 스위칭회로는 제1 스위칭, 제1 커패시턴스, 제1 참조전원, 및 제1 신호증폭기를 포함하며, 상기 제1 스위칭은 공통 (COM)단자, NO단자, NC단자, 제어 (CTR)단자, 전원단자, 및 접지단자를 포함하며, 및/또는
상기 데이터 전환 제어회로는 제2 스위칭회로 및 제3 스위칭회로를 이용하여 구현되며, 상기 제2 스위칭회로는 제2 스위칭, 제2 커패시턴스, 제2 참조전원, 및 제2 신호증폭기를 포함하며, 상기 제2 스위칭은 COM단자, NO단자, NC단자, 및 CTR(제어)단자를 포함하며, 상기 제3 스위칭회로는 제3 스위칭, 제3 커패시턴스, 제3 참조전원, 및 제3 신호증폭기를 포함하며, 상기 제3 스위칭은 COM단자, NO단자, NC단자, CTR단자, 전원단자, 및 접지단자를 포함한다.
상술한 기술안에 있어서, 상기 제1 스위칭회로에 있어서, 상기 제1 스위칭의 COM단자는 상기 마이크로폰의 공통 전원단자와 연결되고, 상기 제1 스위칭의 NC단자는 상기 음성 웨이크 업 공급 전원과 연결되고, 상기 제1 스위칭의 NO단자는 상기 단말기 마스터 제어 공급 전원과 연결되고, 상기 제1 스위칭의 CTR단자는 상기 제1 신호증폭기의 출력단자와 연결되고, 상기 제1 스위칭의 전원단자는 상기 제1 참조전원 및 제1 커패시턴스와 연결되고, 상기 제1 스위칭의 접지단자는 접지되며, 상기 제1 커패시턴스의 다른 일단은 접지되며;
상기 제2 스위칭회로에 있어서, 상기 제2 스위칭의 COM단자는 상기 마이크로폰의 P신호단자와 연결되고, 상기 제2 스위칭의 NC단자는 상기 음성 웨이크 업 회로의 P신호 입력단자와 연결되고, 상기 제2 스위칭의 NO단자는 상기 단말기 마스터 제어 처리 회로의 P신호 입력단자와 연결되고, 상기 제2 스위칭의 CTR단자는 상기 제2 신호증폭기의 출력단자와 연결되고, 상기 제2 스위칭의 전원단자는 상기 제2 참조전원 및 제2 커패시턴스와 연결되고, 상기 제2 스위칭의 접지단자는 접지되며, 상기 제2 커패시턴스의 다른 일단은 접지되며;
상기 제3 스위칭회로에 있어서, 상기 제3 스위칭의 COM단자는 상기 마이크로폰의 N신호단자와 연결되고, 상기 제3 스위칭의 NC단자는 상기 음성 웨이크 업 회로의 N신호 입력단자와 연결되고, 상기 제3 스위칭의 NO단자는 상기 단말기 마스터 제어 처리 회로의 N신호 입력단자와 연결되고, 상기 제3 스위칭의 CTR제어단자는 상기 제3 신호증폭기의 출력단자와 연결되고, 상기 제3 스위칭의 전원단자는 상기 제3 참조전원 및 제3 커패시턴스와 연결되고, 상기 제3 스위칭의 접지단자는 접지되며, 상기 제3 커패시턴스의 다른 일단은 접지된다.
상술한 기술안에 있어서, 상기 음성 웨이크 업 사전 처리회로는 제4 커패시턴스, 제5 커패시턴스, 제6 커패시턴스, 제7 커패시턴스, 제8 커패시턴스, 제9 커패시턴스, 제4 신호증폭기, 제5 신호증폭기, 제1 저주파 통과 필터, 및 제2 저주파 통과 필터를 포함하며, 및/또는 상기 음성 웨이크 업 매칭회로는 아날로그-디지털 변환기(ADC), 마이크로 컨트롤 프로세서(MCU), 메모리를 포함한다.
상술한 기술안에 있어서, 상기 음성 웨이크 업 사전 처리회로에 있어서, 상기 제4 커패시턴스의 입력단자는 신호 P입력단자와 연결되고, 상기 제4 커패시턴스의 출력단자는 상기 제4 신호증폭기의 입력단자와 연결되고, 상기 제4 신호증폭기의 출력단자는 상기 제6 커패시턴스의 입력단자와 연결되고, 상기 제6 커패시턴스의 출력단자와 상기 제1 저주파 통과 필터의 입력단자와 연결되고, 상기 제1 저주파 통과 필터의 츨력단자는 상기 제8 커패시턴스의 입력단자와 연결되고, 상기 제8 커패시턴스의 출력단자는 상기 음성 웨이크 업 매칭회로의 입력단자와 연결되고, 상기 제5 커패시턴스의 입력단자는 신호N입력단자와 연결되고, 상기 제5 커패시턴스의 출력단자는 상기 제5 신호증폭기의 입력단자와 연결되고, 상기 제5 신호증폭기의 출력단자는 상기 제7 커패시턴스의 입력단자와 연결되고, 상기 제7 커패시턴스의 출력단자는 상기 제2 저주파 통과 필터의 입력단자와 연결되고, 상기 제2 저주파 통과 필터의 출력단자는 상기 제9 커패시턴스의 입력단자와 연결되고, 상기 제9 커패시턴스의 출력단자는 상기 음성 웨이크 업 매칭회로의 입력단자와 연결되며;
상기 음성 웨이크 업 매칭회로에 있어서, 상기 ADC의 입력단자는 상기 음성 웨이크 업 사전 처리회로의 출력단자와 연결되고, 상기ADC의 출력단자는 상기 MCU의 입력단자와 연결되고, 상기 메모리는 상기MCU의 출력단자와 연결된다.
상술한 기술안에 기반하여, 본 발명의 또 다른 실시예에서 음성 웨이크 업 방법을 제공하며, 상기 방법은,
음성 웨이크 업 명령을 수신하였을 경우 음성 웨이크 업 공급 전원을 통하여 마이크로폰에 전원 공급하며, 상기 마이크로폰을 통해 음성 신호를 수집하는 단계; 및
상기 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 상응하는 조작을 수행하는 단계를 포함한다.
상술한 기술안에 있어서, 상기 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 이에 상응하는 조작을 수행하는 단계는,
상기 음성 신호에 대하여 증폭, 저주파 통과 필터처리를 진행하여 사전 처리된 음성 신호를 얻는 단계;
사전 처리된 음성 신호에 대하여 아날로그-디지털 전환을 진행하여 디지털화 된 음성 신호를 얻는 단계;
디지털화 된 음성 신호를 저장된 복수 개 템플릿 음성 신호와 비교하는 단계;
디지털화 된 음성 신호와 어느 한 템플릿 음성 신호의 매칭도가 사전 설정된 매칭도 임계치보다 크거나 같을 경우 단말기를 웨이크 업 하는 단계; 및
디지털화 된 음성 신호와 모든 템플릿 음성 신호의 매칭도가 사전 설정된 매칭도 임계치보다 작을 경우 처리 프로세스를 종료하는 단계를 포함한다.
상술한 기술안에 있어서, 상기 방법은,
음성 정상 작업 명령을 수신하였을 경우 단말기 마스터 제어 공급 전원을 통하여 상기 마이크로폰에 전원 공급하는 단계; 및
상기 마이크로폰을 통하여 음성 신호를 수집하여 상기 음성 신호에 대하여 상응하는 처리를 진행하여 음성 정상 작업을 완료하는 단계를 더 포함한다.
본 발명의 실시예에 의해 제공되는 음성 웨이크 업 방법 및 장치에 따르면, 마이크로폰, 음성 웨이크 업 공급 전원, 음성 웨이크 업 매칭회로, 단말기 마스터 제어 공급 전원, 및 단말기 마스터 제어 처리회로는 모두 단말기 자체에 의해 제공되는 회로이며, 상기 단말기는 단지 하나의 마이크로폰을 통해 시분할 다중화를 진행하면 음성 웨이크 업 기능 및 음성 정상 기능을 구현할 수 있기에, 종래기술 중 하나의 전문 마이크로폰 추가를 통한 음성 웨이크 업 신호의 수집, 및 추가된 전문 마이크로폰을 위한 오디오 회로 디자인, 구조 디자인, 신원식별자(ID) 디자인을 진행할 필요가 없으며, 따라서 본 발명의 실시예에 따르면 간단한 회로구조를 가지는 동시에 음성 웨이크 업을 구현할 수 있으며 또한 원가가 비교적 저가이다.
도 1은 본 발명의 실시예에 따른 단말기의 구조 구성을 나타낸 모식도이다.
도 2는 본 발명의 실시예에 따른 전원 전환 제어회로의 구조 구성을 나타낸 모식도이다.
도 3a는 본 발명의 실시예에 따른 데이터 전환 제어회로의 제2 스위칭회로의 구조 구성을 나타낸 모식도이다.
도 3b는 본 발명의 실시예에 따른 데이터 전환 제어회로의 제3 스위칭회로의 구조 구성을 나타낸 모식도이다.
도 4는 본 발명의 실시예에 따른 음성 웨이크 업 사전 처리회로의 구조 구성을 나타낸 모식도이다.
도 5는 본 발명의 실시예에 따른 음성 웨이크 업 매칭회로의 구조 구성을 나타낸 모식도이다.
도 6은 본 발명의 실시예에 따른 음성 웨이크 업 방법의 구현 프로세스를 나타낸 모식도이다.
본 발명의 실시예에 있어서, 음성 웨이크 업 명령을 수신하였을 경우 음성 웨이크 업 공급 전원을 통하여 마이크로폰에 전원 공급하며 상기 마이크로폰을 통해 음성 신호를 수집하며; 상기 음성 신호에 대하여 사전 처리 및 매칭을 진행하며 매칭결과에 따라 상응하는 조작을 수행한다.
이하 첨부도면을 참조하여 본 발명의 실시 양태에 대하여 상세히 설명한다.
도 1에 도시된 바와 같이, 본 발명의 실시예는 단말기를 제공하며, 상기 단말기는 마이크로폰(10), 전원 전환 제어회로(11), 데이터 전환 제어회로(12), 음성 웨이크 업 회로(13), 및 음성 웨이크 업 공급 전원(14)를 포함한다.
상기 마이크로폰(10)은 음성 신호를 수집하여 상기 음성 신호를 상기 데이터 전환 제어회로(12)에 입력하도록 구성된다.
상기 전원 전환 제어회로(11)은 음성 웨이크 업 명령을 수신하였을 경우 상기 음성 웨이크 업 공급 전원(14)을 통해 상기 마이크로폰(10)에 전원 공급하도록 구성된다.
상기 데이터 전환 제어회로(12)는 음성 웨이크 업 명령을 수신하였을 경우 상기 음성 신호를 음성 웨이크 업 회로(13)에 입력하도록 구성된다.
상기 음성 웨이크 업 회로(13)는 입력된 음성 신호에 대하여 사전 처리(pre-processing) 및 매칭을 진행하여 매칭 결과에 따라 이에 상응하는 조작을 수행하도록 구성된다.
여기서, 사용자가 단말기의 음성 웨이크 업 기능을 오픈할 경우 단말기는 프로세서는 음성 웨이크 업 기능에 대한 사용자의 오픈 조작을 식별해 낼 수 있으며, 상기 프로세서는 상기 전원 전환 제어회로(11)에 음성 웨이크 업 명령을 수신한다. 상기 전원 전환 제어회로(11)는 음성 웨이크 업 명령을 수신하였을 경우 단말기가 음성 웨이크 업 대기 상태에 있음을 확정하고 상기 음성 웨이크 업 공급 전원(14)를 통해 상기 마이크로폰(10)에 전원 공급하며, 이때 상기 마이크로폰(10)은 음성 신호를 수집하기 시작한다.
구체적으로, 상기 음성 웨이크 업 회로(13)은 음성 웨이크 업 사전 처리회로(130) 및 음성 웨이크 업 매칭회로(131)을 포함한다.
상기 음성 웨이크 업 사전 처리회로(130)는 입력된 음성 신호에 대하여 사전 처리를 진행한 후 음성 웨이크 업 매칭회로(131)에 입력하도록 구성된다.
상기 음성 웨이크 업 매칭회로(131)은 사전 처리를 진행한 음성 신호에 대하여 매칭을 진행하여 매칭결과에 따라 이에 상응하는 조작을 수행하도록 구성된다.
또한 상기 단말기는 단말기 마스터 제어 처리회로(15) 및 단말기 마스터 제어 공급 전원(16)을 더 포함한다.
상기 전원 전환 제어회로(11)는 음성 정상 작업 명령을 수신하였을 경우 상기 단말기 마스터 제어 공급 전원(16)을 통해 상기 마이크로폰(10)으로 전원 공급하도록 더 구성된다.
상기 데이터 전환 제어회로(12)는 음성 정상 작업 명령을 수신하였을 경우 상기 음성 신호를 상기 단말기 마스터 제어 처리회로(15)에 입력하도록 더 구성된다.
상기 단말기 마스터 제어 처리회로(15)는 입력된 음성 신호에 대하여 상응하는 처리를 진행하여 음성 정상 작업을 완료하도록 구성된다.
여기서, 상기 전원 전환 제어 회로(11)은 음성 정상 작업 명령을 수신하였을 경우 단말기가 음성 정상 작업 상태에 있음을 확정하고, 상기 단말기 마스터 제어 공급 전원(16)을 통해 상기 마이크로폰(10)에 전원 공급하며, 이때 마이크로폰(10)은 음성 신호를 수집하기 시작한다.
여기서, 음성 정상 작업 상태는 일반적으로 단말기가 영상 통화 또는 음성 통화의 작업 상태를 가리킨다.
이하 도 2를 참조하여 실제 응용에 있어서 전원 전환 제어회로(11)의 구체적인 구조 구성 및 각 소자의 연결관계에 대하여 상세히 설명하도록 한다.
도 2에 도시된 바와 같이, 상기 전원 전환 제어회로(11)은 제1 스위칭회로를 이용하여 구현되며, 상기 제1 스위칭회로는 제1 스위칭(K1), 제1 커패시턴스(C1), 제1 참조전원(V1), 및 제1 신호증폭기(A1)를 포함하며, 상기 제1 스위칭은 공통 (COM)단자, NO단자, NC단자, 제어(CTR)단자, 전원단자, 및 접지단자를 포함한다.
상기 제1 스위칭회로에서 각 소자의 연결관계는 구체적으로 다음과 같다.
상기 제1 스위칭(K1)의 COM단자는 상기 마이크로폰(10)의 공통 전원단자와 연결되고, 상기 제1 스위칭(K1)의 NC단자는 상기 음성 웨이크 업 공급 전원(14)와 연결되고, 상기 제1 스위칭(K1)의 NO단자는 상기 단말기 마스터 제어 공급 전원(16)과 연결되고, 상기 제1 스위칭(K1)의 CTR단자는 상기 제1 신호증폭기(A1)의 출력단자와 연결되고, 상기 제1 스위칭(K1)의 전원단자는 상기 제1 참조전원(V1) 및 제1 커패시턴스(C1)의 일단과 연결되고, 상기 제1 스위칭(K1)의 접지단자는 접지되며, 상기 제1 커패시턴스(C1)의 다른 일단은 접지된다.
여기서, 상기 제1 스위칭(K1)의 NO단자와 NC단자의 전환은 제어(CTR)단자의 제어를 받으며, 음성 웨이크 업 명령을 수신하였을 경우 CTR단자는 제1 신호증폭기(A1)를 통해 하이/로우 레벨 제어 신호를 입력하며, 상기 제1 스위칭(K1)의 NC단자와 COM단자가 연통되도록 제어한다. 음성 정상 작업 명령을 수신하였을 경우 CTR단자는 제1 신호증폭기(A1)를 통해 하이/로우 레벨 제어 신호를 입력하며, 상기 제1 스위칭(K1)의 NO단자와 COM단자가 연통되도록 제어한다. 이로써 마이크로폰 전원의 전환을 실현하며, 상기 제어 신호는 단말기의 프로세서 등 제어소자로부터 발송될 수 있다.
이하 도 3을 참조하여 실제 응용에 있어서 데이터 전환 제어회로(12)의 구체적인 구조 구성 및 각 소자의 연결관계에 대하여 상세히 설명하도록 한다.
도 3a에 도시된 바와 같이, 상기 데이터 전환 제어회로(12)는 제2 스위칭회로 및 제3 스위칭회로를 이용하여 구현되며, 상기 제2 스위칭회로는 제2 스위칭(K2), 제2 커패시턴스(C2), 제2 참조전원(V2), 및 제2 신호증폭기(A2)를 포함하며, 상기 제2 스위칭(K2)은 COM단자, NO단자, NC단자, 및 CTR단자를 포함한다.
도 3b에 도시된 바와 같이, 상기 제3 스위칭회로는 제3 스위칭(K3), 제3 커패시턴스(C3), 제3 참조전원(V3), 및 제3 신호증폭기(A3)를 포함하며, 상기 제3 스위칭(K3)은 COM단자, NO단자, NC단자, CTR단자, 전원단자, 및 접지단자를 포함한다.
상기 제2 스위칭회로에서 각 소자의 연결관계는 구체적으로 다음과 같다.
상기 제2 스위칭(K2)의 COM단자는 상기 마이크로폰(10)의 P신호단자와 연결되고, 상기 제2 스위칭(K2)의 NC단자는 상기 음성 웨이크 업 회로(13)의 P신호 입력단자와 연결되고, 상기 제2 스위칭(K2)의 NO단자는 상기 단말기 마스터 제어 처리 회로(15)의 P신호 입력단자와 연결되고, 상기 제2 스위칭(K2)의 CTR단자는 상기 제2 신호증폭기(A2)의 출력단자와 연결되고, 상기 제2 스위칭(K2)의 전원단자는 상기 제2 참조전원(V2) 및 제2 커패시턴스(C2)와 연결되고, 상기 제2 스위칭(K2)의 접지단자는 접지되며, 상기 제2 커패시턴스(C2)의 다른 일단은 접지된다.
상기 제3 스위칭회로에서 각 소자의 연결관계는 구체적으로 다음과 같다.
상기 제3 스위칭(K3)의 COM단자는 상기 마이크로폰(10)의 N신호단자와 연결되고, 상기 제3 스위칭(K3)의 NC단자는 상기 음성 웨이크 업 회로(13)의 N신호 입력단자와 연결되고, 상기 제3 스위칭(K3)의 NO단자는 상기 단말기 마스터 제어 처리 회로(15)의 N신호 입력단자와 연결되고, 상기 제3 스위칭(K3)의 CTR제어단자는 상기 제3 신호증폭기(A3)의 출력단자와 연결되고, 상기 제3 스위칭(K3)의 전원단자는 상기 제3 참조전원(V3) 및 제3 커패시턴스(C3)와 연결되고, 상기 제3 스위칭(K3)의 접지단자는 접지되며, 상기 제3 커패시턴스(C3)의 다른 일단은 접지된다.
여기서, 상기 마이크로폰(10)의 P 신호 단자와 N 신호 단자를 통해 음성 신호를 수집하며 각각 제2 스위칭회로 및 제3 스위칭회로에 입력하며, 상기 음성 웨이크 업 회로(13)의 입력단자는 P 신호 입력단자와 N 신호 입력단자로 나뉘어 지며, 상기 단말기 마스터 제어 처리회로(15)의 입력단자도 P 신호 입력단자와 N 신호 입력단자로 나뉘어 진다.
여기서, 상기 제2 스위칭(K2)의 NO단자와 NC단자의 전환은CTR단자의 제어를 받으며, 음성 웨이크 업 명령을 수신하였을 경우 CTR단자는 제1 신호증폭기(A1)를 통해 하이/로우 레벨 제어 신호를 입력하며, 상기 제2 스위칭(K2)의 NC단자와 COM단자가 연통되도록 제어한다. 음성 정상 작업 명령을 수신하였을 경우 CTR단자는 제2 신호증폭기(A2)를 통해 하이/로우 레벨 제어 신호를 입력하며, 상기 제2 스위칭(K2)의 NO단자와 COM단자가 연통되도록 제어한다. 이로써 마이크로폰 P 신호단자의 전환을 실현하며, 상기 제어 신호는 단말기의 프로세서 등 제어소자로부터 발송될 수 있다.
여기서, 상기 제3 스위칭(K3)의 NO단자와 NC단자의 전환은CTR단자의 제어를 받으며, 음성 웨이크 업 명령을 수신하였을 경우 CTR단자는 제1 신호증폭기(A1)를 통해 하이/로우 레벨 제어 신호를 입력하며, 상기 제3 스위칭(K3)의 NC단자와 COM단자가 연통되도록 제어한다. 음성 정상 작업 명령을 수신하였을 경우 CTR단자는 제3 신호증폭기(A3)를 통해 하이/로우 레벨 제어 신호를 입력하며, 상기 제3 스위칭(K3)의 NO단자와 COM단자가 연통되도록 제어한다. 이로써 마이크로폰 N 신호단자의 전환을 실현하며, 상기 제어 신호는 단말기의 프로세서 등 제어소자로부터 발송될 수 있다.
이하 도 4를 참조하여 실제 응용에 있어서 상기 음성 웨이크 업 사전 처리회로(130)의 구체적인 구조 구성 및 각 소자의 연결관계에 대하여 상세히 설명하도록 한다.
도 4에 도시된 바와 같이, 상기 음성 웨이크 업 사전 처리회로(130)은 제4 커패시턴스(C4), 제5 커패시턴스(C5), 제6 커패시턴스(C6), 제7 커패시턴스(C7), 제8 커패시턴스(C8), 제9 커패시턴스(C9), 제4 신호증폭기(A4), 제5 신호증폭기(A5), 제1 저주파 통과 필터(H1), 및 제2 저주파 통과 필터(H2)를 포함한다.
상기 음성 웨이크 업 사전 처리회로(130)에서 각 소자의 연결관계는 다음과 같다.
상기 제4 커패시턴스(C4)의 입력단자는 신호 P입력단자와 연결되고, 상기 제4 커패시턴스(C4)의 출력단자는 상기 제4 신호증폭기(A4)의 입력단자와 연결되고, 상기 제4 신호증폭기(A4)의 출력단자는 상기 제6 커패시턴스(C6)의 입력단자와 연결되고, 상기 제6 커패시턴스(C6)의 출력단자와 상기 제1 저주파 통과 필터(H1)의 입력단자와 연결되고, 상기 제1 저주파 통과 필터(H1)의 츨력단자는 상기 제8 커패시턴스(C8)의 입력단자와 연결되고, 상기 제8 커패시턴스(C8)의 출력단자는 상기 음성 웨이크 업 매칭회로(131)의 입력단자와 연결되고, 상기 제5 커패시턴스(C5)의 입력단자는 신호N입력단자와 연결되고, 상기 제5 커패시턴스(C5)의 출력단자는 상기 제5 신호증폭기(A5)의 입력단자와 연결되고, 상기 제5 신호증폭기(A5)의 출력단자는 상기 제7 커패시턴스(C7)의 입력단자와 연결되고, 상기 제7 커패시턴스(C7)의 출력단자는 상기 제2 저주파 통과 필터(H2)의 입력단자와 연결되고, 상기 제2 저주파 통과 필터(H2)의 출력단자는 상기 제9 커패시턴스(C9)의 입력단자와 연결되고, 상기 제9 커패시턴스(C9)의 출력단자는 상기 음성 웨이크 업 매칭회로(131)의 입력단자와 연결된다.
여기서, 상기 마이크로폰(10)의 P 신호 단자와 N 신호 단자는 각각 양극 음성 신호와 음극 음성 신호를 수집하며, 상기 양극 음성 신호는 MIC_P_RAW로 기록하고 음극 음성 신호는 MIC_N_RAW로 기록한다. 우선, 상기 음성 웨이크 업 사전 처리회로(130)은 전환하여 오게 된 MIC_P_RAW 및 MIC_N_RAW에 대하여 제4 커패시턴스(C4) 및 제5 커패시턴스(C5)를 통해 격리하여, 상기 음성 웨이크 업 사전 처리회로(130)과 상기 데이터 전환 제어회로(12)가 서로 영향주지 않도록 한다. 그 다음, 격리된 MIC_P_RAW 및 MIC_N_RAW에 대하여 제4 신호증폭기(A4) 및 제5 신호증폭기(A5)를 통해 증폭처리를 진행하여 후속의 처리하도록 한다. 상기 제4 신호증폭기(A4) 및 제5 신호증폭기(A5)는 아날로그 증폭기이며, 증폭의 배수는 상기 ADC의 진폭 범위에 의해 설정된다. 제6 커패시턴스(C6) 및 제7 커패시턴스(C7)를 통해 증폭된 음성 신호에 대하여 격리처리를 진행하여 전 레벨 회로와 후 레벨 회로가 서로 영향주지 않도록 한다. 격리된 음성 신호에 대하여 저주파 통과 필터처리를 진행하며 한쌍의 저주파 통과 필터, 즉 제1 저주파 통과 필터(H1) 및 제2 저주파 통과 필터(H2)를 사용하여 저주파의 음성 신호만을 보류하며, 상기 제1 저주파 통과 필터(H1) 및 상기 제2 저주파 통과 필터(H2) 필터 범위는 후속의 MCU 및 메모리의 템플릿 음성 신호의 주파수 범위에 의해 설정된다. 상기 제1 저주파 통과 필터(H1) 및 상기 제2 저주파 통과 필터(H2)를 통과한 후 대응되는 주파수의 음성 신호를 얻는다. 그 다음에 제8 커패시턴스(C8) 및 제9 커패시턴스(C9)를 통해 대응되는 주파수의 음성 신호에 대하여 격리처리를 진행하여 상기 음성 웨이크 업 사전 처리회로(130)과 상기 음성 웨이크 업 매칭회로(131)가 서로 영향주지 않도록 한다. 최종적으로 사전 처리를 완료하여 양극 음성 신호인 MIC_P_RROCESSED 및 음극 음성 신호인 MIC_N_RROCESSED를 얻는다.
이하 도 5를 참조하여 실제 응용에 있어서 상기 음성 웨이크 업 매칭회로(131)의 구체적인 구조 구성 및 각 소자의 연결관계에 대하여 상세히 설명하도록 한다.
도 5에 도시된 바와 같이, 상기 음성 웨이크 업 매칭회로(131)은 아날로그-디지털 변환기(ADC), 마이크로 컨트롤 프로세서(MCU), 메모리를 포함한다.
상기 음성 웨이크 업 매칭회로(131)에서 각 소자의 연결관계는 다음과 같다.
상기 ADC의 입력단자는 상기 음성 웨이크 업 사전 처리회로(130)의 출력단자와 연결되고, 상기ADC의 출력단자는 상기 MCU의 입력단자와 연결되고, 상기 메모리는 상기MCU의 출력단자와 연결된다.
여기서, 사전 처리된 양극 음성 신호인 MIC_P_RROCESSED 및 음극 음성 신호인 MIC_N_RROCESSED는 상기 ADC에 입력되어 아날로그-디지털 전환을 진행하여 디지털화 된 음성 신호를 얻어서 상기 MCU에 입력하며, 상기 MCU는 디지털화 된 음성 신호와 메모리에 저장된 복수 개 템플릿 음성 신호를 비교하며, 여기서 복수 개 템플릿 음성 신호는 사전에 기입하여 음성 매칭의 기준으로 하며, 디지털화 된 음성 신호와 어느 한 템플릿 음성 신호의 매칭도가 사전 설정된 임계치보다 크거나 같을 경우 INT 인터럽트 신호를 발송하여 단말기를 웨이크 업 하며, 디지털화 된 음성 신호와 모든 템플릿 음성 신호의 매칭도가 사전 설정된 임계치보다 작을 경우 처리 프로세스를 종료하고 계속 대기한다. 예를 들면, 사전에 “Hello LUT” 및 “LUT Hello”를 기입하여 음성 매칭의 기준으로 한다. “Hello LUT”를 디지털 음성 신호로 전환하면 1010111010이며, “LUT Hello”를 디지털 음성 신호로 전환하면 1101010101이며, 수집된 디지털화 된 음성 신호인 1010111110의 사전 설정된 매칭도 임계치가 80%이다. 디지털화 된 음성 신호인 1010111110는 차례로 두 개 음성 매칭의 기준과 비교하며, 디지털화 된 음성 신호인1010111110과 음성 매칭의 기준의 하나인 1010111010의 매칭도가 90%이므로 매칭 성공이며 INT 인터럽트 신호를 발송하여 단말기를 웨이크 업 한다.
여기서, 실제 상황에 따라 상기 매칭도 임계치를 사전 설정할 수 있으며, 일반적으로 상기 매칭도 임계치의 범위는 70%~80%이다.
여기서, 아날로그-디지털 전환은 샘플링, 양자화, 인코딩을 포함하며, 샘플링 빈도는 후속의 MCU와 메모리의 템플릿 음성 신호의 디지털화의 샘플링 빈도에 의해 설정된다.
본 발명의 실시예에 있어서, 상술한 회로 구조 구성 및 소자 간 연결관계에 기반하여 음성 웨이크 업의 작업원리는 다음과 같다.
우선, 상기 전원 전환 제어회로(11)은 음성 웨이크 업 명령을 수신하였을 경우 상기 음성 웨이크 업 공급 전원(14)를 통해 마이크로폰(10)에 전원 공급한다.
그 다음, 상기 마이크로폰(10)은 음성 신호를 수집하여 상기 음성 신호를 상기 데이터 전환 제어회로(12)에 입력하며, 상기 데이터 전환 제어회로(12)는 상기 음성 신호를 상기 음성 웨이크 업 회로(13)에 전송한다.
마지막에, 상기 음성 웨이크 업 회로(13)는 입력된 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 상응하는 조작을 수행한다.
여기서, 상기 음성 웨이크 업 회로(13)가 상기 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 상응하는 조작을 수행하는 것은 구체적으로 다음과 같은 단계를 포함한다.
우선, 상기 음성 웨이크 업 사전 처리회로(130)이 상기 음성 신호에 대하여 증폭, 저주파 통과 필터 등 사전 처리 조작을 진행하며, 사전 처리된 음성 신호를 상기 음성 웨이크 업 매칭회로(131)에 입력한다.
그 다음, 상기 음성 웨이크 업 매칭회로(131)은 사전 처리된 음성 신호에 대하여 아날로그-디지털 전환을 진행하여 디지털화 된 음성 신호를 얻고, 디지털화 된 음성 신호를 저장된 복수 개 템플릿 음성 신호와 비교한다.
만약 디지털화 된 음성 신호와 어느 한 템플릿 음성 신호의 매칭도가 사전 설정된 매칭도 임계치보다 크거나 같을 경우 단말기를 웨이크 업 한다.
만약 디지털화 된 음성 신호와 모든 템플릿 음성 신호의 매칭도가 사전 설정된 매칭도 임계치보다 작을 경우 처리 프로세스를 종료한다.
본 발명의 실시예에 있어서, 마이크로폰(10), 음성 웨이크 업 공급 전원(14), 음성 웨이크 업 매칭회로(131), 단말기 마스터 제어 공급 전원(16), 및 단말기 마스터 제어 처리회로(15)는 모두 단말기 자체에 의해 제공되는 회로이며, 상기 단말기는 단지 하나의 마이크로폰을 통해 시분할 다중화를 진행하면 음성 웨이크 업 기능 및 음성 정상 기능을 구현할 수 있기에, 종래기술 중 하나의 전문 마이크로폰 추가를 통한 음성 웨이크 업 신호의 수집, 및 추가된 전문 마이크로폰을 위한 오디오 회로 디자인, 구조 디자인, 신원식별자(ID) 디자인을 진행할 필요가 없으며, 따라서 본 발명의 실시예에 따르면 간단한 회로구조를 가지는 동시에 음성 웨이크 업을 구현할 수 있으며 또한 원가가 비교적 저가이다.
동일한 기술적 구상에 기반하여 본 발명의 또 다른 실시예에서는 음성 웨이크 업 방법을 제공한다. 상기 방법의 문제 해결 원리가 회로, 장치와 유사하므로 방법의 실시 프로세스 및 실시 원리는 모두 전술된 장치의 실시 프로세스 및 실시 원리에 대한 설명을 참조할 수 있으며, 여기서 상세한 설명을 생략한다.
도 6에 도시된 바와 같이, 본 발명의 실시예에 따른 음성 웨이크 업 방법은 다음과 같은 단계를 포함한다.
단계 S600에 있어서, 음성 웨이크 업 명령을 수신하였을 경우 음성 웨이크 업 공급 전원을 통하여 마이크로폰에 전원 공급하며, 상기 마이크로폰을 통해 음성 신호를 수집한다.
여기서, 음성 웨이크 업 명령을 수신하였을 경우 음성 웨이크 업 공급 전원을 통하여 마이크로폰에 전원 공급하며, 이때 마이크로폰은 음성 신호를 수집하기 시작한다.
단계 S601에 있어서, 상기 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 상응하는 조작을 수행한다.
구체적으로 상기 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 상응하는 조작을 수행하는 단계는 다음과 같은 단계를 포함한다.
상기 음성 신호에 대하여 증폭, 저주파 통과 필터 등 처리를 진행하여 최종적으로 사전 처리된 음성 신호를 얻는다.
그 다음, 사전 처리된 음성 신호에 대하여 아날로그-디지털 전환을 진행하여 디지털화 된 음성 신호를 얻는다.
디지털화 된 음성 신호를 저장된 복수 개 템플릿 음성 신호와 비교한다.
만약 디지털화 된 음성 신호와 어느 한 템플릿 음성 신호의 매칭도가 사전 설정된 매칭도 임계치보다 크거나 같을 경우 단말기를 웨이크 업 한다.
만약 디지털화 된 음성 신호와 모든 템플릿 음성 신호의 매칭도가 사전 설정된 매칭도 임계치보다 작을 경우 처리 프로세스를 종료한다.
또한 음성 정상 작업 명령을 수신하였을 경우 단말기 마스터 제어 공급 전원을 통하여 마이크로폰에 전원 공급하며,
상기 마이크로폰을 통해 음성 신호를 수집하여 상기 음성 신호에 대하여 상응하는 처리를 진행하여 음성 정상 작업을 완료한다.
본 발명의 바람직한 실시예에 대하여 설명하였으며 본 발명의 기술분야의 통상의 지식을 가진 자에 있어서 기본적인 창조성 개념을 얻은 후 이런 실시예에 대하여 별도의 변경 및 수정을 진행할 수 있다. 따라서 첨부된 청구의 범위는 바람직한 실시예 및 본 발명의 범위내 진행된 모든 변경 및 수정을 포함하고자 한다.
통상의 기술자에게 있어서 본 발명은 각종 변경과 변화가 있을 수 있다. 본 발명의 정신과 원칙 내에서 진행한 어떠한 수정, 동등교체, 개진 등은 모두 본 발명의 보호범위 내에 포함되어야 한다.
[산업상 이용 가능성]
본 발명의 실시예에 의해 제공되는 음성 웨이크 업 방법 및 장치에 따르면, 마이크로폰, 음성 웨이크 업 공급 전원, 음성 웨이크 업 매칭회로, 단말기 마스터 제어 공급 전원, 및 단말기 마스터 제어 처리회로는 모두 단말기 자체에 의해 제공되는 회로이며, 상기 단말기는 단지 하나의 마이크로폰을 통해 시분할 다중화를 진행하면 음성 웨이크 업 기능 및 음성 정상 기능을 구현할 수 있기에, 종래기술 중 하나의 전문 마이크로폰 추가를 통한 음성 웨이크 업 신호의 수집, 및 추가된 전문 마이크로폰을 위한 오디오 회로 디자인, 구조 디자인, 신원식별자(ID) 디자인을 진행할 필요가 없으며, 따라서 본 발명의 실시예에 따르면 간단한 회로구조를 가지는 동시에 음성 웨이크 업을 구현할 수 있으며 또한 원가가 비교적 저가이다.

Claims (10)

  1. 단말기에 있어서,
    상기 단말기는 마이크로폰, 전원 전환 제어회로, 데이터 전환 제어회로, 음성 웨이크 업 회로, 및 음성 웨이크 업 공급 전원을 포함하며,
    상기 마이크로폰은 음성 신호를 수집하여 상기 음성 신호를 상기 데이터 전환 제어회로에 입력하도록 구성되며,
    상기 전원 전환 제어회로는 음성 웨이크 업 명령을 수신하였을 경우 상기 음성 웨이크 업 공급 전원을 통해 상기 마이크로폰에 전원 공급하도록 구성되며,
    상기 데이터 전환 제어회로는 음성 웨이크 업 명령을 수신하였을 경우 상기 음성 신호를 음성 웨이크 업 회로에 입력하도록 구성되며,
    상기 음성 웨이크 업 회로는 입력된 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 이에 상응하는 조작을 수행하도록 구성되는 것을 특징으로 하는 단말기.
  2. 청구항 1에 있어서,
    상기 음성 웨이크 업 회로는,
    입력된 음성 신호에 대하여 사전 처리를 진행한 후 음성 웨이크 업 매칭회로에 입력하도록 구성되는 음성 웨이크 업 사전 처리회로; 및
    사전 처리를 진행한 음성 신호에 대하여 매칭을 진행하여 매칭결과에 따라 이에 상응하는 조작을 수행하도록 구성되는 음성 웨이크 업 매칭회로를 포함하는 것을 특징으로 하는 단말기.
  3. 청구항 1에 있어서,
    상기 단말기는 단말기 마스터 제어 처리회로 및 단말기 마스터 제어 공급 전원을 더 포함하며,
    상기 전원 전환 제어회로는 음성 정상 작업 명령을 수신하였을 경우 상기 단말기 마스터 제어 공급 전원을 통해 상기 마이크로폰으로 전원 공급하도록 더 구성되며,
    상기 데이터 전환 제어회로는 음성 정상 작업 명령을 수신하였을 경우 상기 음성 신호를 상기 단말기 마스터 제어 처리회로에 입력하도록 더 구성되며,
    상기 단말기 마스터 제어 처리회로는 입력된 음성 신호에 대하여 상응하는 처리를 진행하여 음성 정상 작업을 완료하도록 구성되는 것을 특징으로 하는 단말기.
  4. 청구항 3에 있어서,
    상기 전원 전환 제어회로는 제1 스위칭회로를 이용하여 구현되며, 상기 제1 스위칭회로는 제1 스위칭, 제1 커패시턴스, 제1 참조전원, 및 제1 신호증폭기를 포함하며, 상기 제1 스위칭은 공통 (COM)단자, NO단자, NC단자, 제어 (CTR)단자, 전원단자, 및 접지단자를 포함하며, 및/또는
    상기 데이터 전환 제어회로는 제2 스위칭회로 및 제3 스위칭회로를 이용하여 구현되며, 상기 제2 스위칭회로는 제2 스위칭, 제2 커패시턴스, 제2 참조전원, 및 제2 신호증폭기를 포함하며, 상기 제2 스위칭은 COM단자, NO단자, NC단자, 및 CTR(제어)단자를 포함하며, 상기 제3 스위칭회로는 제3 스위칭, 제3 커패시턴스, 제3 참조전원, 및 제3 신호증폭기를 포함하며, 상기 제3 스위칭은 COM단자, NO단자, NC단자, CTR단자, 전원단자, 및 접지단자를 포함하는 것을 특징으로 하는 단말기.
  5. 청구항 4에 있어서,
    상기 제1 스위칭회로에 있어서, 상기 제1 스위칭의 COM단자는 상기 마이크로폰의 공통 전원단자와 연결되고, 상기 제1 스위칭의 NC단자는 상기 음성 웨이크 업 공급 전원과 연결되고, 상기 제1 스위칭의 NO단자는 상기 단말기 마스터 제어 공급 전원과 연결되고, 상기 제1 스위칭의 CTR단자는 상기 제1 신호증폭기의 출력단자와 연결되고, 상기 제1 스위칭의 전원단자는 상기 제1 참조전원 및 제1 커패시턴스와 연결되고, 상기 제1 스위칭의 접지단자는 접지되며, 상기 제1 커패시턴스의 다른 일단은 접지되며,
    상기 제2 스위칭회로에 있어서, 상기 제2 스위칭의 COM단자는 상기 마이크로폰의 P신호단자와 연결되고, 상기 제2 스위칭의 NC단자는 상기 음성 웨이크 업 회로의 P신호 입력단자와 연결되고, 상기 제2 스위칭의 NO단자는 상기 단말기 마스터 제어 처리 회로의 P신호 입력단자와 연결되고, 상기 제2 스위칭의 CTR단자는 상기 제2 신호증폭기의 출력단자와 연결되고, 상기 제2 스위칭의 전원단자는 상기 제2 참조전원 및 제2 커패시턴스와 연결되고, 상기 제2 스위칭의 접지단자는 접지되며, 상기 제2 커패시턴스의 다른 일단은 접지되며,
    상기 제3 스위칭회로에 있어서, 상기 제3 스위칭의 COM단자는 상기 마이크로폰의 N신호단자와 연결되고, 상기 제3 스위칭의 NC단자는 상기 음성 웨이크 업 회로의 N신호 입력단자와 연결되고, 상기 제3 스위칭의 NO단자는 상기 단말기 마스터 제어 처리 회로의 N신호 입력단자와 연결되고, 상기 제3 스위칭의 CTR제어단자는 상기 제3 신호증폭기의 출력단자와 연결되고, 상기 제3 스위칭의 전원단자는 상기 제3 참조전원 및 제3 커패시턴스와 연결되고, 상기 제3 스위칭의 접지단자는 접지되며, 상기 제3 커패시턴스의 다른 일단은 접지되는 것을 특징으로 하는 단말기.
  6. 청구항 2에 있어서,
    상기 음성 웨이크 업 사전 처리회로는 제4 커패시턴스, 제5 커패시턴스, 제6 커패시턴스, 제7 커패시턴스, 제8 커패시턴스, 제9 커패시턴스, 제4 신호증폭기, 제5 신호증폭기, 제1 저주파 통과 필터, 및 제2 저주파 통과 필터를 포함하며, 및/또는 상기 음성 웨이크 업 매칭회로는 아날로그-디지털 변환기(ADC), 마이크로 컨트롤 프로세서(MCU), 메모리를 포함하는 것을 특징으로 하는 단말기.
  7. 청구항 6에 있어서,
    상기 음성 웨이크 업 사전 처리회로에 있어서, 상기 제4 커패시턴스의 입력단자는 신호 P입력단자와 연결되고, 상기 제4 커패시턴스의 출력단자는 상기 제4 신호증폭기의 입력단자와 연결되고, 상기 제4 신호증폭기의 출력단자는 상기 제6 커패시턴스의 입력단자와 연결되고, 상기 제6 커패시턴스의 출력단자와 상기 제1 저주파 통과 필터의 입력단자와 연결되고, 상기 제1 저주파 통과 필터의 츨력단자는 상기 제8 커패시턴스의 입력단자와 연결되고, 상기 제8 커패시턴스의 출력단자는 상기 음성 웨이크 업 매칭회로의 입력단자와 연결되고, 상기 제5 커패시턴스의 입력단자는 신호N입력단자와 연결되고, 상기 제5 커패시턴스의 출력단자는 상기 제5 신호증폭기의 입력단자와 연결되고, 상기 제5 신호증폭기의 출력단자는 상기 제7 커패시턴스의 입력단자와 연결되고, 상기 제7 커패시턴스의 출력단자는 상기 제2 저주파 통과 필터의 입력단자와 연결되고, 상기 제2 저주파 통과 필터의 출력단자는 상기 제9 커패시턴스의 입력단자와 연결되고, 상기 제9 커패시턴스의 출력단자는 상기 음성 웨이크 업 매칭회로의 입력단자와 연결되며,
    상기 음성 웨이크 업 매칭회로에 있어서, 상기 ADC의 입력단자는 상기 음성 웨이크 업 사전 처리회로의 출력단자와 연결되고, 상기ADC의 출력단자는 상기 MCU의 입력단자와 연결되고, 상기 메모리는 상기MCU의 출력단자와 연결되는 것을 특징으로 하는 단말기.
  8. 음성 웨이크 업 방법에 있어서,
    음성 웨이크 업 명령을 수신하였을 경우 음성 웨이크 업 공급 전원을 통하여 마이크로폰에 전원 공급하며, 상기 마이크로폰을 통해 음성 신호를 수집하는 단계; 및
    상기 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 이에 상응하는 조작을 수행하는 단계를 포함하는 것을 특징으로 하는 음성 웨이크 업 방법.
  9. 청구항 8에 있어서,
    상기 음성 신호에 대하여 사전 처리 및 매칭을 진행하여 매칭 결과에 따라 이에 상응하는 조작을 수행하는 단계는,
    상기 음성 신호에 대하여 증폭, 저주파 통과 필터처리를 진행하여 사전 처리된 음성 신호를 얻는 단계;
    사전 처리된 음성 신호에 대하여 아날로그-디지털 전환을 진행하여 디지털화 된 음성 신호를 얻는 단계;
    디지털화 된 음성 신호를 저장된 복수 개 템플릿 음성 신호와 비교하는 단계;
    디지털화 된 음성 신호와 어느 한 템플릿 음성 신호의 매칭도가 사전 설정된 매칭도 임계치보다 크거나 같을 경우 단말기를 웨이크 업 하는 단계; 및
    디지털화 된 음성 신호와 모든 템플릿 음성 신호의 매칭도가 사전 설정된 매칭도 임계치보다 작을 경우 처리 프로세스를 종료하는 단계를 포함하는 것을 특징으로 하는 음성 웨이크 업 방법.
  10. 청구항 8 또는 청구항 9에 있어서,
    상기 방법은,
    음성 정상 작업 명령을 수신하였을 경우 단말기 마스터 제어 공급 전원을 통하여 상기 마이크로폰에 전원 공급하는 단계; 및
    상기 마이크로폰을 통하여 음성 신호를 수집하여 상기 음성 신호에 대하여 상응하는 처리를 진행하여 음성 정상 작업을 완료하는 단계를 더 포함하는 것을 특징으로 하는 음성 웨이크 업 방법.
KR1020177007481A 2014-08-19 2015-04-13 음성 웨이크 업 방법 및 장치 KR101902717B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410410717.3A CN105376389B (zh) 2014-08-19 2014-08-19 一种语音唤醒方法及设备
CN201410410717.3 2014-08-19
PCT/CN2015/076493 WO2016026316A1 (zh) 2014-08-19 2015-04-13 一种语音唤醒方法及设备

Publications (2)

Publication Number Publication Date
KR20170044689A true KR20170044689A (ko) 2017-04-25
KR101902717B1 KR101902717B1 (ko) 2018-09-28

Family

ID=55350165

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177007481A KR101902717B1 (ko) 2014-08-19 2015-04-13 음성 웨이크 업 방법 및 장치

Country Status (5)

Country Link
US (1) US20170287480A1 (ko)
EP (1) EP3185521B1 (ko)
KR (1) KR101902717B1 (ko)
CN (1) CN105376389B (ko)
WO (1) WO2016026316A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101983928B1 (ko) * 2016-07-12 2019-05-29 선전 구딕스 테크놀로지 컴퍼니, 리미티드 전력 공급 관리를 진행할 수 있는 웨어러블 기기 및 방법
CN108663942B (zh) * 2017-04-01 2021-12-07 青岛有屋科技有限公司 一种语音识别设备控制方法、语音识别设备和中控服务器
CN108877788B (zh) * 2017-05-08 2021-06-11 瑞昱半导体股份有限公司 具有语音唤醒功能的电子装置及其操作方法
CN107277672B (zh) * 2017-06-07 2020-01-10 福州瑞芯微电子股份有限公司 一种支持唤醒模式自动切换的方法和装置
CN107886964B (zh) * 2017-09-25 2024-05-31 惠州市德赛西威汽车电子股份有限公司 一种音频处理方法及其系统
FR3075442B1 (fr) * 2017-12-19 2019-11-22 Sagemcom Broadband Sas Dispositif et procede d'assistance vocale
CN108922536A (zh) * 2018-06-28 2018-11-30 深圳市沃特沃德股份有限公司 语音唤醒处理器工作的方法及系统
CN109119082A (zh) * 2018-10-22 2019-01-01 深圳锐越微技术有限公司 语音唤醒电路及电子设备
CN110751949A (zh) * 2019-10-18 2020-02-04 北京声智科技有限公司 一种语音识别方法、装置及计算机可读存储介质
CN112147801B (zh) * 2020-09-25 2023-01-24 上海市第二康复医院 骨传导发声辅助系统、方法、设备及存储介质
CN115097925B (zh) * 2022-06-20 2023-06-06 清华大学 零功耗声音自唤醒系统及唤醒方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
JP2008236288A (ja) * 2007-03-20 2008-10-02 Konica Minolta Business Technologies Inc 電子データ格納支援装置、画像形成装置、電子データ格納方法、およびコンピュータプログラム
US20090043580A1 (en) * 2003-09-25 2009-02-12 Sensory, Incorporated System and Method for Controlling the Operation of a Device by Voice Commands
JP2011259088A (ja) * 2010-06-07 2011-12-22 Willcom Inc 携帯通信機器および情報管理装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6408396B1 (en) * 2001-05-04 2002-06-18 Intel Corporation Method and apparatus for supporting wake-on voice and wake-on MIC technology
US9031847B2 (en) * 2011-11-15 2015-05-12 Microsoft Technology Licensing, Llc Voice-controlled camera operations
CN202384000U (zh) * 2011-12-20 2012-08-15 上海博泰悦臻电子设备制造有限公司 语音处理装置、车载终端设备
CN103955149A (zh) * 2011-12-30 2014-07-30 南阳首控光电有限公司 Dsp语音识别用于激光大屏幕拼接控制系统
CN102546953A (zh) * 2012-02-07 2012-07-04 深圳市金立通信设备有限公司 一种全语音操控移动终端的系统及方法
CN103701981B (zh) * 2012-09-27 2016-05-25 中兴通讯股份有限公司 一种实现语音识别功能的方法及装置
US9703350B2 (en) * 2013-03-15 2017-07-11 Maxim Integrated Products, Inc. Always-on low-power keyword spotting
CN103747129B (zh) * 2013-12-25 2016-03-02 科大讯飞股份有限公司 一种带声纹解锁和唤醒的蓝牙系统
US9779725B2 (en) * 2014-12-11 2017-10-03 Mediatek Inc. Voice wakeup detecting device and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US20090043580A1 (en) * 2003-09-25 2009-02-12 Sensory, Incorporated System and Method for Controlling the Operation of a Device by Voice Commands
JP2008236288A (ja) * 2007-03-20 2008-10-02 Konica Minolta Business Technologies Inc 電子データ格納支援装置、画像形成装置、電子データ格納方法、およびコンピュータプログラム
JP2011259088A (ja) * 2010-06-07 2011-12-22 Willcom Inc 携帯通信機器および情報管理装置

Also Published As

Publication number Publication date
CN105376389A (zh) 2016-03-02
EP3185521B1 (en) 2018-10-17
KR101902717B1 (ko) 2018-09-28
WO2016026316A1 (zh) 2016-02-25
CN105376389B (zh) 2020-02-14
US20170287480A1 (en) 2017-10-05
EP3185521A1 (en) 2017-06-28
EP3185521A4 (en) 2017-08-09

Similar Documents

Publication Publication Date Title
KR101902717B1 (ko) 음성 웨이크 업 방법 및 장치
WO2018137704A1 (zh) 一种基于麦克风阵列的拾音方法及系统
AU1740801A (en) Methods and apparatuses for signal analysis
CN103873977A (zh) 基于多麦克风阵列波束成形的录音系统及其实现方法
US20170116980A1 (en) Time-Based Frequency Tuning of Analog-to-Information Feature Extraction
CN203984647U (zh) 具有语音激活检测的麦克风
CN209845280U (zh) 语音音响拾音电路及装置
CN105182763A (zh) 一种基于语音识别的智能遥控器及实现方法
CN104780483A (zh) 具有语音激活检测的麦克风
CN107277683B (zh) 一种音频放大系统及方法
CN103139688A (zh) 一种消除环境噪音的方法、装置和助听器
CN208173243U (zh) 一种猪声音信号采集系统
CN111182416B (zh) 处理方法、装置及电子设备
CN112349291A (zh) 基于ai降噪模型的扩声系统及方法
CN106161780A (zh) 具有扬声器降噪功能的通信装置及其降噪方法
CN205666067U (zh) 麦克风阵列语音增强电路
CN106686488A (zh) 麦克风
CN112969126B (zh) 声学传感器系统、信号处理系统、方法及电子设备
WO2020238703A1 (zh) 获取语音信号的方法及装置
CN103731768A (zh) 一种声音拾取方法及装置
CN110099328A (zh) 一种智能音箱
CN109361367B (zh) 一种适用于智能功放芯片的变频自动增益控制装置
CN209168731U (zh) 机器人语音控制系统
CN205693744U (zh) 具有扬声器降噪功能的通信装置
CN214476381U (zh) 一种语音降噪系统

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant