KR20160113255A - 항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴 - Google Patents

항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴 Download PDF

Info

Publication number
KR20160113255A
KR20160113255A KR1020167023360A KR20167023360A KR20160113255A KR 20160113255 A KR20160113255 A KR 20160113255A KR 1020167023360 A KR1020167023360 A KR 1020167023360A KR 20167023360 A KR20167023360 A KR 20167023360A KR 20160113255 A KR20160113255 A KR 20160113255A
Authority
KR
South Korea
Prior art keywords
location
ambient noise
processor
logic
audio processor
Prior art date
Application number
KR1020167023360A
Other languages
English (en)
Other versions
KR102018152B1 (ko
Inventor
더블유. 웡 홍
와 이유 퀑
샤오궈 량
지안쳉 타오
지안 왕
Original Assignee
인텔 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인텔 코포레이션 filed Critical 인텔 코포레이션
Publication of KR20160113255A publication Critical patent/KR20160113255A/ko
Application granted granted Critical
Publication of KR102018152B1 publication Critical patent/KR102018152B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3293Power saving characterised by the action undertaken by switching to a less power-consuming processor, e.g. sub-CPU
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0209Power saving arrangements in terminal devices
    • H04W52/0251Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity
    • H04W52/0254Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity detecting a user operation or a tactile contact or a motion of the device
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72457User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to geographic location
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • Y02B60/50
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephone Function (AREA)
  • Power Sources (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴에 관한 방법 및 장치가 설명된다. 일 실시예에서, 로직은 위치에 대한 주변 잡음 트리거 레벨 분석을 수행하고, 주변 잡음 트리거 레벨 분석에 기초하는 위치에 대한 주변 잡음 트리거 레벨 임계값의 저장을 유발한다. 또한, 로직은 위치에서의 오디오 프로세서의 검출 및 위치에서의 검출된 사운드 레벨과 저장된 주변 잡음 트리거 레벨 임계값의 비교에 응답하여 오디오 프로세서의 상태에 대한 변경을 유발할지를 결정한다. 다른 실시예들도 개시되고 청구된다.

Description

항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴{LOCATION AWARE POWER MANAGEMENT SCHEME FOR ALWAYS-ON-ALWAYS-LISTEN VOICE RECOGNITION SYSTEM}
본 개시는 일반적으로 전자 분야에 관한 것이다. 구체적으로, 일 실시예는 항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴에 관한 것이다.
휴대용 컴퓨팅 디바이스들은 부분적으로는 이들의 가격 저하 및 성능 향상으로 인해 인기를 끌고 있다. 이들의 인기 증가의 다른 이유는 일부 휴대용 컴퓨팅 디바이스들이 예로서 배터리 전력에 의존함으로써 많은 위치에서 동작할 수 있다는 사실에 기인할 수 있다. 그러나, 휴대용 컴퓨팅 디바이스들 내에 더 많은 기능이 통합됨에 따라, 예로서 연장된 기간 동안 배터리 전력을 유지하기 위해 전력 소비를 줄일 필요성이 점점 더 중요해진다.
상세한 설명이 첨부 도면을 참조하여 제공된다. 도면들에서, 참조 부호의 제일 왼쪽 숫자(들)는 참조 부호가 처음 나타나는 도면을 식별한다. 서로 다른 도면에서 동일한 참조 번호를 사용하는 것은 유사하거나 동일한 항목을 나타낸다.
도 1 및 4-5는 본 명세서에서 설명되는 다양한 실시예들을 구현하는 데 사용될 수 있는 컴퓨팅 시스템들의 실시예들의 블록도들을 나타낸다.
도 2-3은 일부 실시예들에 따른 흐름도들을 나타낸다.
도 6은 일 실시예에 따른 SOC(System On Chip) 패키지의 블록도를 나타낸다.
이하의 설명에서, 다양한 실시예에 대한 완전한 이해를 제공하기 위해 수많은 구체적인 상세가 기술되어 있다. 그러나, 다양한 실시예들은 이러한 특정 상세 없이 실시될 수 있다. 다른 경우들에 있어서, 이미 알려진 방법, 절차, 구성 요소, 및 회로들은 특정 실시예들을 모호하게 하지 않기 위해 상세하게 설명되지 않았다. 또한, 실시예들의 다양한 양태들은 다양한 수단, 예컨대 집적 반도체 회로들("하드웨어"), 하나 이상의 프로그램으로 체계화된 컴퓨터 판독가능 명령어들("소프트웨어"), 또는 하드웨어와 소프트웨어의 소정 조합을 이용하여 수행될 수 있다. 본 개시의 목적을 위해, "로직"에 대한 언급은 하드웨어, 소프트웨어, 펌웨어 또는 이들의 소정 조합을 의미할 것이다.
전술한 바와 같이, 효율적인 전력 소비 관리는 이동 컴퓨팅 디바이스들에 대해 매우 중요하다. 전력 소비에 상당한 영향을 줄 수 있는, 이동 디바이스 내에 존재하는 한 가지 타입의 컴포넌트는 오디오이다. 항상-온-항상-청취 음성 인식 시스템의 거짓 트리거들은 이동 디바이스 내의 시스템 배터리 수명에 영향을 줄 것이다. 예로서, DSP(Digital Signal Processor) 기반 항상-온-항상-청취(또는 WoV - Wake On Voice) 시스템은 능동적인 "키 문구 검출" 상태에서 4 mW를 소비할 수 있다(이에 비해, 유휴 및 "음성 명령 검출" 상태에서는 수 μW만을 소비).
이 때문에, 일부 실시예들은 항상-온-항상-청취(또는 WoV) 음성 인식 시스템들에 대한 위치 인식 전력 관리 스킴들을 제공한다. 일 실시예는 능동적인 "키 문구 검출" 상태에서 DSP의 주파수를 줄인다(여기서, WoV 시스템의 "음성 명령 검출" 상태의 거짓 트리거링으로 인해 능동적인 "키 문구 검출" 상태에 들어갈 수 있다). 이러한 접근법은 또한 전반적인 시스템 전력 소비를 줄인다. 일부 실시예들은 사용되는 시스템의 위치에 적어도 부분적으로 기초하여 (예로서, 능동적인 "키 문구 검출" 상태로의 진입을 유발하는) "음성 명령 검출" 상태에 대한 주변 잡음 트리거 프로필의 설정을 자동화함으로써 더 양호한 UX(User experience)를 제공할 수도 있다.
일부 구현들은 사용자가 사용되는 시스템의 위치에 대해 "음성 명령 검출" 상태에 대한 주변 잡음 트리거 임계치를 수동으로 설정하게 함으로써 거짓 트리거 레이트를 줄일 수 있다. 예로서, 시스템은 사무실, 실험실 등과 같은 다양한 위치에 대한 잡음 트리거 임계치를 포함할 수 있다. 시스템은 또한 사용자가 사용되는 시스템의 위치에 따라 "음성 명령 검출" 상태에 대한 임계치를 "수동으로" 선택하게 할 수 있다. 이와 달리, 일 실시예는 하나 이상의 센서를 사용하여 주변 잡음 트리거 레벨을 설정하기 위한 이러한 프로세스를 자동화하고, 항상-온-항상-청취 음성 인식 시스템에서 "키 문구 검출" 상태의 거짓 트리거링을 최소화할 수 있다. 이것은 또한 전체 시스템 전력 소비를 줄이며, 최종 사용자들에게 더 양호한 UX를 제공할 수도 있다.
일부 실시예들은 예로서 스마트폰, 태블릿, UMPC (Ultra-Mobile Personal Computer), 랩탑 컴퓨터, 울트라북(상표) 컴퓨팅 디바이스, 스마트 시계, 스마트 안경, 웨어러블 디바이스 등과 같은 이동 컴퓨팅 디바이스들을 포함하는, 도 1-6을 참조하여 설명되는 것들과 같은 (예로서, 하나 이상의 프로세서 코어를 갖는) 하나 이상의 프로세서를 포함하는 컴퓨팅 시스템들에서 적용될 수 있다. 더 구체적으로, 도 1은 일 실시예에 따른 컴퓨팅 시스템(100)의 블록도를 나타낸다. 시스템(100)은 (본 명세서에서 일반적으로 "프로세서들(102)" 또는 "프로세서(102)"로 지칭되는) 하나 이상의 프로세서(102-1 내지 102-N)를 포함할 수 있다. 프로세서들(102)은 다양한 실시예들에서 범용 CPU들(Central Processing Units) 및/또는 GPU들(Graphics Processing Units)일 수 있다. 프로세서들(102)은 상호접속 또는 버스(104)를 통해 통신할 수 있다. 각각의 프로세서는 다양한 컴포넌트들을 포함할 수 있고, 이들 중 일부가 단지 명료화를 위해 프로세서(102-1)를 참조하여 설명된다. 따라서, 나머지 프로세서들(102-2 내지 102-N) 각각은 프로세서(102-1)를 참조하여 설명되는 동일한 또는 유사한 컴포넌트들을 포함할 수 있다.
일 실시예에서, 프로세서(102-1)는 (본 명세서에서 "코어들(106)" 또는 "코어(106)"로 지칭되는) 하나 이상의 프로세서 코어(106-1 내지 106-M), 캐시(108) 및/또는 라우터(110)를 포함할 수 있다. 프로세서 코어들(106)은 단일 집적 회로(IC) 칩 상에 구현될 수 있다. 더욱이, 칩은 하나 이상의 공유 및/또는 비공개 캐시(예로서, 캐시(108)), 버스 또는 상호접속(예로서, 버스 또는 상호접속(112)), 그래픽 및/또는 메모리 제어기(예로서, 도 2-6을 참조하여 설명되는 것들), 또는 다른 컴포넌트들을 포함할 수 있다.
일 실시예에서, 라우터(110)는 프로세서(102-1) 및/또는 시스템(100)의 다양한 컴포넌트들 사이에서 통신하는 데 사용될 수 있다. 더욱이, 프로세서(102-1)는 2개 이상의 라우터(110)를 포함할 수 있다. 더구나, 다수의 라우터(110)는 프로세서(102-1) 안의 또는 밖의 다양한 컴포넌트들 사이의 데이터 라우팅을 가능하게 하도록 통신할 수 있다.
캐시(108)는 코어들(106)과 같은 프로세서(102-1)의 하나 이상의 컴포넌트에 의해 사용되는 (예로서, 명령어들을 포함하는) 데이터를 저장할 수 있다. 예로서, 캐시(108)는 프로세서(102)의 컴포넌트들에 의한 더 빠른 액세스(예로서, 코어들(106)에 의한 더 빠른 액세스)를 위해 메모리(114)에 저장된 데이터를 국지적으로 캐싱할 수 있다. 도 1에 도시된 바와 같이, 메모리(114)는 상호접속(104)을 통해 프로세서들(102)과 통신할 수 있다. 일 실시예에서, (공유될 수 있는) 캐시(108)는 중간 레벨 캐시(MLC), 최종 레벨 캐시(LLC) 등일 수 있다. 또한, 코어들(106) 각각은 (본 명세서에서 일반적으로 "L1 캐시(116)"로 지칭되는) 레벨 1(L1) 캐시(116-1) 또는 다른 레벨의 캐시, 예로서 레벨 2(L2) 캐시를 포함할 수 있다. 더욱이, 프로세서(102-1)의 다양한 컴포넌트들은 캐시(108)와 직접, 버스(예로서, 버스(112)) 및/또는 메모리 제어기 또는 허브를 통해 통신할 수 있다.
도시된 바와 같이, 시스템(100)은 또한 로직(140), 하나 이상의 센서(150), 및 (DSP 등과 같은) 오디오 프로세서(160)를 포함할 수 있다. 센서(들)(150)는 (글로벌 포지셔닝 시스템(GPS) 센서(예로서, 진보된 GPS(aGPS), 글로벌 내비게이션 위성 시스템(GNSS)를 포함함), 무선 충실도(와이파이), 블루투스 등의 센서(들), 주변 오디오 센서(들), 가속도계, 나침반, 자이로, 자기계, 압력, 주변광, 온도 등을 통해 검출된 위치 데이터와 같은) 센서 데이터를 제공하여, (오디오 설정, 전화 설정, 게임 등과 같은) 전체 범위의 애플리케이션들에 대한 (예로서, 스마트폰, 태블릿, UMPC(Ultra-Mobile Personal Computer), 랩탑 컴퓨터, 울트라북(상표) 컴퓨팅 디바이스, 스마트 시계, 스마트 안경, 웨어러블 디바이스 등과 같은 이동 컴퓨팅 디바이스들을 포함하는 컴퓨팅 디바이스들을 사용할 때) 사용자 경험을 향상시킨다. 센서(들)(150)는 (항상-온-항상-청취 음성 인식 시스템과 같은) 항상-온 감지, 모션 기반 제스처, 사용자 활동 상태, 보수계 등을 포함하는 다양한 특징들을 지원하여 애플리케이션들의 상이한 카테고리들을 가능하게 할 수 있다.
일 실시예에서, 로직(140)은 예로서 센서(들)(150)에 의해 검출된 정보에 기초하여 능동적인 "키 문구 검출" 상태에서 오디오 프로세서(160)의 주파수를 줄인다. 이러한 접근법은 전체적인 시스템 전력 소비를 줄인다. 로직(140)은 또한 예로서 센서(들)(150)에 의해 검출되는 바와 같은 사용되는 시스템의 위치에 적어도 부분적으로 기초하여 주변 잡음 트리거 프로필의 설정을 자동화함으로써 더 양호한 UX를 제공할 수 있다. 더구나, 로직(140)은 도시되거나 그 외의 것들과 같은 시스템(100) 내의 다양한 위치들에서 제공될 수 있다. 따라서, 로직(140)은 오디오 프로세서(160) 및/또는 센서(들)(150)에 통신 결합되어, 다양한 실시예들과 관련하여 설명되는 특징들을 제공한다. 게다가, 로직(140)은 일부 실시예들에서 오디오 프로세서(160)를 포함할 수 있다.
도 2는 일 실시예에 따른, 항상-온-항상-청취 음성 인식 시스템에 대한 주변 잡음 임계치의 위치 인식 설정을 위한 흐름도를 나타낸다. 도시된 바와 같이, 하나 이상의 센서(예로서, 센서(들)(150))를 이용하여, 사용되는 컴퓨팅 디바이스의 위치를 결정하고, 그에 따라 "음성 명령 검출" 상태에 대한 주변 잡음 트리거 레벨을 설정할 수 있다. 도 2와 관련하여 설명되는 다양한 동작들은 (예로서, 프로세서 코어(들)(106), 로직(140), 센서(들)(150) 및/또는 오디오 프로세서(160) 중 하나 이상을 포함하는) 도 1의 컴포넌트들 중 하나 이상에 의해 수행될 수 있다.
도 1-2를 참조하면, 동작 202에서, (본 명세서에서 분석으로도 교환 가능하게 지칭되는) 주변 잡음 임계치 교정 동작(들)이 예로서 도 1과 관련하여 도시되고 설명되는 것과 같은 다양한 위치들(옥외, 실내, 차안 등)로부터의 센서 데이터에 기초하여 하나 이상의 위치에 대해 (예로서, 코어들(106) 및/또는 로직(140)에 의해) 수행된다. 일부 실시예들에서, (본 명세서에서 트리거 레벨들/값들로도 지칭되는) 상이한 주변 잡음 임계 레벨들/값들이 시각에 따라 설정될 수 있다(예로서, 카페는 다른 시간보다 조식, 중식 또는 석식쯤에 잡음이 더 많을 수 있다). 결정된 임계 값들은 디바이스에 의한 미래의 액세스를 위해 (본 명세서에서 설명되는 임의의 저장 디바이스와 같은) 메모리 내에 저장된다(또는 동일 와이파이/WWAN 네트워크에 결합된 디바이스들 사이에서 공유된다). 또한, 트리거 정보는 웹사이트에서 이용 가능할 수 있으며, 위치 인식 로직은 디바이스의 위치를 식별하고, (예로서, 특정 도시에 대한 온도/날씨 정보를 얻는 방식과 유사하게) 오디오 트리거 설정을 획득한다. 따라서, 동작 202은 이동 컴퓨팅 디바이스의 위치에 기초하여 항상-온-항상-청취 서브시스템에 대한 주변 잡음 트리거 임계치 프로필의 (예로서, 데이터베이스로부터 검색되는) 설정을 자동화한다.
이동 디바이스들 상의 항상-온-항상-청취 음성 인식 구현은 2개 이상의 스테이지를 포함할 수 있으며: 제1 스테이지 - 음성 명령 검출은 (예로서, 동작 204에서) (오디오 프로세서(160)와 같은) 저전력 오디오 프로세서를 이용하여 주변 잡음 모니터링한다. 이러한 오디오 프로세서에 대한 전력 소비는 수 마이크로 와트의 범위 내에 있을 수 있으며, 저전력 오디오 프로세서는 항상 온 상태일 수 있다. 이러한 저전력 오디오 프로세서가 (예로서, 206에서) 주변 잡음 레벨 위의 사운드 레벨을 검출하는 경우, (예로서, 동작 208에서) 제2 스테이지 - 키 문구 검출을 트리거할 것이며, 이는 캡처된 사운드가 명령(예로서, 음성 명령 또는 키 문구)인지를 분석하기 위해 (DSP 및/또는 하나 이상의 프로세서 코어(106)와 같은) 고성능 오디오 프로세서를 턴온한다. (예로서, 캡처된 사운드를 허용 가능 음성 명령들 또는 키 문구들의 리스트/표와 비교함으로써) 캡처된 사운드가 명령 또는 키 문구인 것으로 결정되는 경우, 고성능 오디오 프로세서는 대응하는 명령을 수행할 것이며; 이와 달리 명령이 아닐 경우에, 음성 인식 서브시스템(예로서, 로직(140) 및/또는 오디오 프로세서(160))은 유휴 상태 또는 저전력 상태로 돌아갈 것이다. 이러한 고성능 오디오 프로세서(또는 이러한 DSP의 기능은 중앙 처리 유닛(CPU) 또는 프로세서(102)/코어(106)에 의해 대체될 수 있음)는 구현에 따라 4 mW 이상을 소비할 수 있다.
더구나, 시스템이 "키 문구 검출" 상태에서 거짓 트리거들을 계속 수신하는 경우, 시스템은 이러한 거짓 트리거들을 처리하기 위해 추가 전력을 낭비할 수 있다. 이동 디바이스들의 경우, 하나의 위치로부터 다른 위치로의 이동은 주변 잡음 레벨들을 변경하는 경향이 있다. 주변 잡음 레벨이 사용자 디바이스의 위치에 따라 설정되는 경우, 거짓 트리거의 빈도가 감소할 수 있다. 이 때문에, 일 실시예는 실험실, 차안, 사무실 등과 같은 상이한 위치들에 대해 (본 명세서에서 분석된으로도 교환 가능하게 지칭되는) 교정된 주변 잡음 트리거 레벨의 설정을 자동화한다.
일부 실시예들은 아래의 기술들을 이용하여 주변 잡음 레벨을 교정/분석 및 설정한다.
1. 실내의 경우:
(a) 와이파이 위치 기반 도구를 이용하여 사용자 디바이스의 위치를 결정한다. 사용자는 교정 로직(예로서, 로직(140))을 이용하여 해당 특정 장소에서의 주변 잡음 바닥값/최소치를 설정하며;
(b) 나침반 및 가속도계를 이용하여 사용자 디바이스의 위치를 결정한다(데드 레커닝 기술이라고도 함).
2. 옥외의 경우: GPS(예로서, aGPS, GNSS 등)를 이용하여, 사용자가 혼잡한 거리에 있는지, 숲에서 하이킹하고 있는지 등을 결정한다. 사용자는 교정 로직을 이용하여 다양한 장소들에서의 주변 잡음 바닥값/최소치를 교정할 수 있다.
3. 차안: 핸즈프리 BT(Bluetooth)와 같은 차안 무선 디바이스들을 이용하여, 사용자 디바이스가 차안에 있는지를 결정한다. "차안 엔터테인먼트 시스템"은 또한 BT를 이용하여, 차 운전자가 (예로서, 라디오를 듣기 위해) 차안의 오디오 디바이스를 턴온하였다는 정보를 (에로서, 이동 디바이스 상에서 실행되는) 교정 로직에 제공할 수 있고, 볼륨 설정 정보는 교정 로직과 관련될 수 있으며, 이는 ("음성 명령 검출" 상태에서 동작하는) 항상-온-항상-청취 저전력 오디오 프로세서에 대한 주변 잡음 트리거 레벨의 더 정확한 추정을 제공할 수 있다.
주변 잡음 트리거/임계 레벨들은 주어진 위치에서 상이한 시각들에 대해 교정/분석될 수 있다. 일 실시예에서, 주변 잡음 트리거 레벨들은 주변 잡음 및 대화 레벨들 양자에 기초하여 조정될 수 있다. 예로서, 사용자는 오전 7시 30분에 카페에 도착하여 커피 한잔을 마실 수 있다(위치 및 시간에 기초하여, 스테이지 1(음성 명령 검출 상태) 오디오 트리거가 73 dB로 설정될 수 있다). 이후, 오전 8시에, 사용자는 복도를 통해 걸을 수 있다(위치 및 시간에 기초하여, 스테이지 1 오디오 트리거는 예로서 70 dB로 설정될 수 있는데, 이는 대화 레벨들 및/또는 주변 잡음 레벨들이 그 시간에는 복도에서 더 낮을 수 있기 때문이다). 사용자가 오전 8시 이후에 그의 사무실로 돌아오면, 위치 및 시간에 기초하여, 스테이지 1 오디오 트리거는 70 dB로 설정될 수 있다. 이어서, 오전 10시에, 사용자는 일대일 미팅을 위해 카페로 돌아온다(위치 및 시간에 기초하여, 스테이지 1 오디오 트리거는 예로서 84 dB로 설정될 수 있는데, 이는 일대일 미팅이 카페 또는 복도보다 (미팅에서의 대화로 인해) 더 높은 사운드 레벨을 가질 수 있기 때문이다).
일 실시예에서, 오디오 트리거 프로필은 특정 위치에 대해 생성된다. 사람들은 일반적으로 그들의 대화 음성 레벨("SPL" 또는 사운드 압력 레벨)을 주변 잡음 레벨보다 수 dB 위로 조정할 것이라는 점에 주목되었다. 따라서, 주변 잡음 레벨을 설정하고, 그 레벨 위에 약 3-5 dB를 추가할 수 있는 경우, 그것은 "항상-온-항상-청취" 음성 인식 로직의 제1 스테이지(음성 명령 검출 상태)에 대한 트리거 레벨의 설정일 수 있다. 일부 실시예들에서, 아래의 프로세스를 이용하여 주변 잡음 레벨을 정의하고 사용할 수 있다.
(A) 특정 위치에서 24시간 내내 또는 선택된 기간들에 주변 잡음 및 대화를 캡처한다. 이것은 수동으로 또는 캡처/샘플링 작업을 촉진하기 위해 애플리케이션을 작성하여 (울트라북 컴퓨팅 디바이스와 같은) 기록 디바이스 상에서 실행함으로써 행해질 수 있다. 일 실시예에서, 1분/샘플이 사용될 수 있다. 또한, 샘플링의 시간이 저장될 수 있다.
(B) 캡처된 데이터에 대한 탐색표를 생성한다.
(C) 음성 인식 로직이 턴온/활성화될 때마다, 로직(예로서, 로직(140))은 위치 추적 로직, 전자 나침반, 가속도계 등에 의해 (이러한 인식 엔진을 실행하는) 디바이스의 위치를 결정한다. 위치 및 시간이 알려지면, 인식 로직은 탐색표를 검사하고, 대응하는 트리거 설정(예로서, 주변 잡음 레벨 + 3 dB일 수 있음)을 선택한다. 위치 추적 로직, 센서 등은 위치 정보를 계속 공급할 것인데, 이는 사용자가 (예로서, 도 3과 관련하여 설명되는 바와 같이) 위치들을 변경할 수 있기 때문이다. 간격은 전력을 보존하기 위해 (사용자에 의해 구성될 수 있는) 매 30초 또는 1분일 수 있다.
일 실시예에서, 시스템이 접속 대기 상태에 있는 경우(예로서, 사용자 디바이스가 활성 상태보다 낮은 전력 소비 상태에 있으면서도 능동 네트워크 접속을 유지하고, 또한 시스템이 선택 사항으로서 필요한 작업들을 수행하기 위해 주기적으로 깨어나는 경우), 위치 변화의 검출은 시스템의 주기적 웨이크 상태들에 맞춰져서 (예로서, 거짓 트리거들로 인한) 시스템 전력 낭비를 최소화할 것이다. 시스템의 위치 변화는 접속 대기 상태에서의 시스템의 주기적 웨이크보다 느릴 것이므로, 위치 변화의 검출은 시스템 웨이크 상태와 맞춰져서 (예로서, 거짓 트리거들로 인한) 시스템 전력 낭비를 최소화할 수 있다(그러나, 위치 변화는 비교적 느리므로, 예로서 30초당 한 번일 수 있으므로, 자주 그렇지는 않다. 센서 입력은 "위치 결정" 빈도의 최적 결정을 제공할 수 있다).
일 실시예에서, 위치 변화 검출 빈도는 전력 소비를 줄이도록 최적화된다. (도시되지 않고, 센서(들)(150)에 결합될 수 있고/있거나 로직(140) 내에 통합될 수 있는) 센서 허브는 (예로서, 센서(들)(150)로부터의) 센서 입력들을 관리하여 배터리 수명을 최적화할 수 있다. 위치 검출 빈도는 더 감소할 수 있으며, 이것은 추가적인 UX 연구에 기초할 수 있다. 예로서, 위치 변화는 가속도계/모션 센서, 자이로스코프, GNSS/WWAN 위치 결정, 다른 "새로운" 무선 디바이스들의 검출(예로서, 차안의 블루투스 디바이스(핸즈프리 블루투스)) 등에 의해 검출될 수 있다.
따라서, 일부 실시예들은 (예로서, 사용자에 의한 잡음 트리거 임계치의 수동 설정에 의존하는 것이 아니라) 아래의 기술들 중 하나 이상을 이용한다.
1. 센서들 및/또는 aGPS/GNSS, WWAN, BT, 와이파이 등과 같은 기술들의 혼합을 이용하여, 상이한 위치들에 대한 주변 잡음 임계치 트리거 프로필을 설정한다.
2. (이동 디바이스의 위치마다의) 올바른 프로필을 검색하여, (예로서, 항상-온-항상-청취 서브시스템의 일부로서의) 저전력 오디오 프로세서에 대한 잡음 트리거 레벨을 설정/프로그래밍한다.
3. 이러한 동작들이 자동화된다. 이것은 또한 잡음 트리거 임계치의 더 UX 지향적이고 더 정확한(예로서, 최소의 사람 에러를 수반하는) 설정을 제공하여, 음성 인식 시스템의 거짓 트리거를 최소화한다.
도 3은 일 실시예에 따른, 시스템 전력 소비를 최적화하기 위한 적응성 잡음 트리거 설정 조정을 위한 방법(300)의 흐름도를 나타낸다. 이것은 음성 인식 시스템이 음성 트리거 임계치를 적응적으로 설정하는 것을 가능하게 한다. (도 1 및 3-6과 관련하여) 본 명세서에서 설명되는 하나 이상의 컴포넌트가 도 3과 관련하여 설명되는 하나 이상의 동작을 수행하는 데 사용될 수 있다. 예로서, 방법(300)의 하나 이상의 동작은 본 명세서에서 설명되는 바와 같이 로직(140)(또는 도 1-2와 관련하여 설명된 그의 컴포넌트들) 및/또는 센서(들)(150)에 의해 수행될 수 있다.
도 1-3을 참조하면, 동작 302에서, 예로서 (예로서, 하나 이상의 센서(150)로부터의) 센서 정보에 기초하여 (로직(140)에 의해) 사용자 디바이스의 위치가 식별된다. 동작 304에서, 주변 잡음이 (예로서, 로직(140)에 의해 센서(들)(150)로부터의 센서 입력에 따라) 모니터링된다. 예로서, 트리거 임계치가 주변 잡음 레벨보다 다수의 dB(예로서, 3 dB) 위로 설정될 수 있다. (예로서, 로직(140)에 의해 수행되는) 동작 306은 (도 2와 관련하여 설명된 것과 같은) 음성 트리거를 기다린다. (예로서, 로직(140)에 의해 수행되는) 동작 308은 동작 306의 트리거가 거짓 트리거인지 또는 (도 2와 관련하여 설명된 것과 같은) 명령이 아닌지를 결정한다. 그러한 경우, (예로서, 로직(140)에 의해 수행되는) 동작 310은 소정 수의 dB만큼(예로서, 1 dB 더 높게) 트리거 임계 레벨을 변경할 수 있다. 이어서, 방법(300)은 동작 306으로 복귀한다.
이와 달리, 동작 308이 동작 306의 음성 트리거가 거짓이 아닌 것으로 결정하는 경우, (예로서, 로직(140)에 의해 수행되는) 동작 312는 음성 트리거 설정이 올바른 것으로 결정하고, (예로서, 로직(140)에 의해 예로서 센서(들)(150)로부터의 입력에 기초하여 수행되는) 동작 314는 디바이스의 위치가 변경되었는지를 결정할 것이다. 위치가 변경된 경우, 방법(300)은 동작 304에서 재개되며, 그렇지 않은 경우에 방법(300)은 동작 306에서 재개된다.
도 4는 일 실시예에 따른 컴퓨팅 시스템(400)의 블록도를 나타낸다. 컴퓨팅 시스템(400)은 상호접속 네트워크(또는 버스)(404)를 통해 통신하는 하나 이상의 중앙 처리 유닛(CPU)(402) 또는 프로세서를 포함할 수 있다. 프로세서들(402)은 범용 프로세서, (컴퓨터 네트워크(403)를 통해 통신되는 데이터를 처리하는) 네트워크 프로세서, 또는 (축소 명령어 세트 컴퓨터(RISC) 프로세서 또는 복합 명령어 세트 컴퓨터(CISC)를 포함하는) 다른 타입의 프로세서를 포함할 수 있다.
더욱이, 프로세서들(402)은 단일 또는 다중 코어 설계를 가질 수 있다. 다중 코어 설계를 갖는 프로세서들(402)은 동일 집적 회로(IC) 다이 상에 상이한 타입의 프로세서 코어들을 통합할 수 있다. 또한, 다중 코어 설계를 갖는 프로세서들(402)은 대칭 또는 비대칭 멀티프로세서들로서 구현될 수 있다. 일 실시예에서, 프로세서들(402) 중 하나 이상은 도 1의 프로세서들(102)과 동일 또는 유사할 수 있다. 또한, 시스템(400)의 하나 이상의 컴포넌트는 (도 4에 도시된 위치들을 포함하지만 그에 한정되지 않는) 도 1-3과 관련하여 설명된 (도 4에 도시되지 않은) 센서(들)(150)에 결합되는 로직(140)을 포함할 수 있다. 또한, 도 1-3과 관련하여 설명된 동작들은 시스템(400)의 하나 이상의 컴포넌트에 의해 수행될 수 있다.
칩셋(406)은 또한 상호접속 네트워크(404)와 통신할 수 있다. 칩셋(406)은 (도 4에 도시된 것들과 같은) 시스템(400)의 다양한 컴포넌트들 내에 위치할 수 있는 그래픽 메모리 제어 허브(GMCH)(408)를 포함할 수 있다. GMCH(408)는 (도 1의 메모리(114)와 동일 또는 유사할 수 있는) 메모리(412)와 통신하는 메모리 제어기(410)를 포함할 수 있다. 메모리(412)는 CPU(402), 또는 컴퓨팅 시스템(400) 내에 포함된 임의의 다른 디바이스에 의해 실행될 수 있는 명령어들의 시퀀스를 포함하는 데이터를 저장할 수 있다. 일 실시예에서, 메모리(412)는 하나 이상의 휘발성 저장(또는 메모리) 디바이스, 예로서 랜덤 액세스 메모리(RAM), 동적 RAM(DRAM), 동기식 DRAM(SDRAM), 정적 RAM(SRAM) 또는 다른 타입의 저장 디바이스를 포함할 수 있다. 하드 디스크와 같은 비휘발성 메모리도 사용될 수 있다. 다수의 CPU 및/또는 다수의 시스템 메모리와 같은 추가 디바이스들은 상호접속 네트워크(404)를 통해 통신할 수 있다.
GMCH(408)는 디스플레이 디바이스(450)와 통신하는 그래픽 인터페이스(414)도 포함할 수 있다. 일 실시예에서, 그래픽 인터페이스(414)는 가속 그래픽 포트(AGP) 또는 주변 컴포넌트 상호접속(PCI)(또는 PCI 익스프레스(PCIe) 인터페이스)을 통해 디스플레이 디바이스(450)와 통신할 수 있다. 일 실시예에서, (평탄 디스플레이와 같은) 디스플레이는 예로서 비디오 메모리 또는 시스템 메모리와 같은 저장 디바이스에 저장된 이미지의 디지털 표현을 디스플레이 디바이스에 의해 해석 및 표시되는 디스플레이 신호들로 변환하는 신호 컨버터를 통해 그래픽 인터페이스(414)와 통신할 수 있다. 생성된 디스플레이 신호들은 디스플레이 디바이스(450)에 의해 해석된 후에 표시되기 전에 다양한 제어 디바이스들을 통과할 수 있다.
허브 인터페이스(418)는 GMCH(408) 및 입출력 제어 허브(ICH)(420)가 통신하는 것을 가능하게 할 수 있다. ICH(420)는 컴퓨팅 시스템(400)과 통신하는 I/O 디바이스(들)에 대한 인터페이스를 제공할 수 있다. ICH(420)는 주변 컴포넌트 상호접속(PCI) 브리지, 유니버설 직렬 버스(USB) 제어기 또는 다른 타입의 주변장치 브리지 또는 제어기와 같은 주변장치 브리지(또는 제어기)(424)를 통해 버스(422)와 통신할 수 있다. 브리지(424)는 CPU(402)와 주변 디바이스들 사이의 데이터 경로를 제공할 수 있다. 다른 타입의 토폴로지들이 사용될 수 있다. 또한, 다수의 버스가 예로서 다수의 브리지 또는 제어기를 통해 ICH(420)와 통신할 수 있다. 더욱이, ICH(420)와 통신하는 다른 주변장치들은 다양한 실시예들에서 통합 드라이브 일렉트로닉스(IDE) 또는 소형 컴퓨터 시스템 인터페이스(SCSI) 하드 드라이브(들), USB 포트(들), 키보드, 마우스, 병렬 포트(들), 직렬 포트(들), 플로피 디스크 드라이브(들), 디지털 출력 지원(예로서, 디지털 비디오 인터페이스(DVI)) 또는 다른 디바이스들을 포함할 수 있다.
버스(422)는 오디오 디바이스(426), 하나 이상의 디스크 드라이브(들)(428), 및 (컴퓨터 네트워크(403)와 통신하는) 네트워크 인터페이스 디바이스(430)와 통신할 수 있다. 다른 디바이스들은 버스(422)를 통해 통신할 수 있다. 또한, (네트워크 인터페이스 디바이스(430)와 같은) 다양한 컴포넌트들은 일부 실시예들에서 GMCH(408)와 통신할 수 있다. 게다가, 프로세서(402) 및 GMCH(408)는 단일 칩을 형성하도록 결합될 수 있다. 더구나, 다른 실시예들에서 그래픽 가속기가 GMCH(408) 내에 포함될 수 있다.
더구나, 컴퓨팅 시스템(400)은 휘발성 및/또는 비휘발성 메모리(또는 저장소)를 포함할 수 있다. 예로서, 비휘발성 메모리는 판독 전용 메모리(ROM), 프로그래밍 가능 ROM(PROM), 소거 가능 PROM(EPROM), 전기적 EPROM(EEPROM), 디스크 드라이브(예로서, 428), 플로피 디스크, 컴팩트 디스크 ROM(CD-ROM), 디지털 다기능 디스크(DVD), 플래시 메모리, 광자기 디스크, 또는 (예로서, 명령어들을 포함하는) 전자 데이터를 저장할 수 있는 다른 타입의 비휘발성 기계 판독 가능 매체 중 하나 이상을 포함할 수 있다.
도 5는 일 실시예에 따른, 점대점(PtP) 구성으로 배열된 컴퓨팅 시스템(500)을 나타낸다. 특히, 도 5는 프로세서들, 메모리 및 입출력 디바이스들이 다수의 점대점 인터페이스에 의해 상호접속되는 시스템을 나타낸다. 도 1-4와 관련하여 설명되는 동작들은 시스템(500)의 하나 이상의 컴포넌트에 의해 수행될 수 있다.
도 5에 도시된 바와 같이, 시스템(500)은 여러 개의 프로세서를 포함할 수 있으며, 명료화를 위해 그들 중 2개인 프로세서들(502, 504)만이 도시된다. 프로세서들(502, 504)은 각각 메모리들(510, 512)과의 통신을 가능하게 하기 위한 로컬 메모리 제어기 허브(MCH)(506, 508)를 포함할 수 있다. 메모리들(510 및/또는 512)은 도 4의 메모리(412)와 관련하여 설명된 것들과 같은 다양한 데이터를 저장할 수 있다.
일 실시예에서, 프로세서들(502, 504)은 도 4와 관련하여 설명된 프로세서들(402) 중 하나일 수 있다. 프로세서들(502, 504)은 각각 PtP 인터페이스 회로들(516, 518)을 이용하여 점대점(PtP) 인터페이스(514)를 통해 데이터를 교환할 수 있다. 또한, 프로세서들(502, 504)은 각각 점대점 인터페이스 회로들(526, 528, 530, 532)을 이용하여 개별 PtP 인터페이스들(522, 524)을 통해 칩셋(520)과 데이터를 교환할 수 있다. 칩셋(520)은 또한 예로서 PtP 인터페이스 회로(537)를 이용하여 그래픽 인터페이스(536)를 통해 그래픽 회로(534)와 데이터를 교환할 수 있다.
적어도 하나의 실시예가 프로세서들(502, 504) 내에 제공될 수 있다. 또한, 시스템(500)의 하나 이상의 컴포넌트는 (도 5에 도시된 위치들을 포함하지만 이에 한정되지 않는) 도 1-4와 관련하여 설명된 (도 5에 도시되지 않은) 센서(들)(150)에 결합되는 로직(140)을 포함할 수 있다. 그러나, 다른 실시예들은 다른 회로들, 로직 유닛들, 또는 도 5의 시스템(500) 내의 디바이스들 내에 존재할 수 있다. 더구나, 다른 실시예들은 도 5에 도시된 여러 회로, 로직 유닛 또는 디바이스 전반에 분산될 수 있다.
칩셋(520)은 PtP 인터페이스 회로(541)를 이용하여 버스(540)와 통신할 수 있다. 버스(540)는 버스 브리지(542) 및 I/O 디바이스들(543)과 같은 하나 이상의 디바이스와 통신할 수 있다. 버스(544)를 통해, 버스 브리지(542)는 키보드/마우스(545), 통신 디바이스들(546)(예로서, 모뎀, 네트워크 인터페이스 디바이스, 또는 컴퓨터 네트워크(403)와 통신할 수 있는 다른 통신 디바이스), 오디오 I/O 디바이스(547) 및/또는 데이터 저장 디바이스(548)와 같은 다른 디바이스들과 통신할 수 있다. 데이터 저장 디바이스(548)는 프로세서들(502 및/또는 504)에 의해 실행될 수 있는 코드(549)를 저장할 수 있다.
일부 실시예들에서, 본 명세서에서 설명되는 컴포넌트들 중 하나 이상은 시스템 온 칩(SOC) 디바이스로서 구현될 수 있다. 도 6은 일 실시예에 따른 SOC 패키지의 블록도를 나타낸다. 도 6에 도시된 바와 같이, SOC(602)는 하나 이상의 중앙 처리 유닛(CPU) 코어(620), 하나 이상의 그래픽 처리 유닛(GPU) 코어(630), 입출력(I/O) 인터페이스(640) 및 메모리 제어기(642)를 포함한다. SOC 패키지(602)의 다양한 컴포넌트들은 다른 도면들과 관련하여 본 명세서에서 설명된 바와 같은 상호접속 또는 버스에 결합될 수 있다. 또한, SOC 패키지(602)는 다른 도면들과 관련하여 본 명세서에서 설명된 것들과 같은 더 많거나 적은 컴포넌트들을 포함할 수 있다. 또한, SOC 패키지(620)의 각각의 컴포넌트는 예로서 본 명세서에서 다른 도면들과 관련하여 설명된 하나 이상의 다른 컴포넌트를 포함할 수 있다. 일 실시예에서, SOC 패키지(602)(및 그의 컴포넌트들)는 예로서 단일 반도체 디바이스 내에 패키징되는 하나 이상의 집적 회로(IC) 다이 상에 제공된다.
도 6에 도시된 바와 같이, SOC 패키지(602)는 메모리 제어기(642)를 통해 (본 명세서에서 다른 도면들과 관련하여 설명되는 메모리와 유사하거나 동일할 수 있는) 메모리(660)에 결합된다. 일 실시예에서, 메모리(660)(또는 그의 일부)는 SOC 패키지(602) 상에 통합될 수 있다.
I/O 인터페이스(640)는 예로서 본 명세서에서 다른 도면들과 관련하여 설명된 바와 같은 상호접속 및/또는 버스를 통해 하나 이상의 I/O 디바이스(670)에 결합될 수 있다. I/O 디바이스(들)(670)는 키보드, 마우스, 터치패드, 디스플레이 디바이스, 이미지/비디오 캡처 디바이스(예로서, 카메라 또는 캠코더/비디오 레코더), 터치스크린, 스피커 등 중 하나 이상을 포함할 수 있다. 또한, SOC 패키지(602)는 일 실시예에서 로직(140)을 포함/통합할 수 있다. 대안으로서, 로직(140)은 SOC 패키지(602)의 외부에(즉, 개별 로직으로서) 제공될 수 있다.
더욱이, (예로서, 다양한 실시예들에서 그래픽 로직에 의해 처리될 수 있는) 본 명세서에서 설명된 장면들, 이미지들 또는 프레임들은 이미지 캡처 디바이스(예로서, (스마트폰, 태블릿, 랩탑, 독립 카메라 등과 같은 다른 디바이스 내에 내장될 수 있는) 디지털 카메라 또는 캡처된 이미지들이 디지털 형태로 후속 변환되는 아날로그 디바이스)에 의해 캡처될 수 있다. 더욱이, 이미지 캡처 디바이스는 일 실시예에서 다수의 프레임을 캡처할 수 있다. 또한, 장면 내의 프레임들 중 하나 이상은 일부 실시예들에서 컴퓨터 상에서 설계/생성된다. 또한, 장면의 프레임들 중 하나 이상은 (예로서 평판 디스플레이 디바이스 등을 포함하는, 도 4 및/또는 5와 관련하여 설명된 디스플레이와 같은) 디스플레이를 통해 제공될 수 있다.
아래의 예들은 추가 실시예들과 관련된다. 예 1은 위치에 대한 주변 잡음 트리거 레벨 분석을 수행하고, 상기 주변 잡음 트리거 레벨 분석에 기초하는 상기 위치에 대한 주변 잡음 트리거 레벨 임계값의 저장을 유발하기 위한 로직을 포함하고, 상기 로직은 적어도 부분적으로는 하드웨어 로직을 포함하고, 로직은 상기 위치에서의 오디오 프로세서의 검출 및 상기 위치에서의 검출된 사운드 레벨과 상기 저장된 주변 잡음 트리거 레벨 임계값의 비교에 응답하여 상기 오디오 프로세서의 상태에 대한 변경을 유발할지를 결정하는 장치를 포함한다. 예 2는 예 1의 장치를 포함하고, 상기 위치에 대한 주변 잡음 트리거 레벨 분석을 수행하기 위한 로직은 상기 주변 잡음 트리거 레벨 임계값 및 상기 위치에 대한 상기 분석의 시간의 저장을 유발한다. 예 3은 예 1의 장치를 포함하고, 상기 오디오 프로세서의 상기 상태에 대한 변경을 유발하기 위한 로직은 상기 오디오 프로세서 또는 다른 프로세서가 음성 명령을 검출하도록 고성능 상태 또는 고전력 소비 상태에 들어가게 한다. 예 4는 예 1의 장치를 포함하고, 상기 오디오 프로세서의 상기 상태에 대한 변경을 유발하기 위한 로직은 음성 명령의 비검출에 응답하여 상기 오디오 프로세서 또는 다른 프로세서가 저전력 소비 상태 또는 저성능 상태에 머물게 한다. 예 5는 예 1의 장치를 포함하고, 하나 이상의 센서가 상기 오디오 프로세서의 상기 위치를 나타내는 데이터를 검출한다. 예 6은 예 1의 장치를 포함하고, 상기 위치에 대한 상기 저장된 주변 잡음 트리거 레벨 임계값은 복수의 컴퓨팅 디바이스 사이에서 공유된다. 예 7은 예 6의 장치를 포함하고, 상기 복수의 컴퓨팅 디바이스는 동일한 컴퓨터 네트워크에 결합된다. 예 8은 예 1의 장치를 포함하고, 상기 위치에서의 상기 오디오 프로세서의 검출은 주기적 웨이크 상태들과 맞춰진다. 예 9는 예 1의 장치를 포함하고, 상기 위치에서의 상기 오디오 프로세서의 상기 검출이 얼마나 자주 발생할지가 동적으로 조정된다. 예 10은 예 1의 장치를 포함하고, 상기 위치에 대한 상기 주변 잡음 트리거 레벨 분석의 수행 후에 발생하는 거짓 트리거에 기초하여 상기 위치에 대한 상기 주변 잡음 트리거 레벨 임계값을 조정하기 위한 로직을 더 포함한다. 예 11은 예 1의 장치를 포함하고, 하나 이상의 프로세서 코어를 갖는 프로세서가 상기 분석을 수행하기 위한 상기 로직을 포함한다. 예 12는 예 1 내지 11 중 어느 한 예의 장치를 포함하고, 상기 분석을 수행하기 위한 상기 로직, 하나 이상의 프로세서 코어 및 메모리 중 하나 이상이 단일 집적 회로 다이 상에 존재한다.
예 13은 위치에 대한 주변 잡음 트리거 레벨 분석을 수행하고, 상기 주변 잡음 트리거 레벨 분석에 기초하는 상기 위치에 대한 주변 잡음 트리거 레벨 임계값의 저장을 유발하는 단계; 및 상기 위치에서의 오디오 프로세서의 검출 및 상기 위치에서의 검출된 사운드 레벨과 상기 저장된 주변 잡음 트리거 레벨 임계값의 비교에 응답하여 상기 오디오 프로세서의 상태에 대한 변경을 유발할지를 결정하는 단계를 포함하는 방법을 포함한다. 예 14는 예 13의 방법을 포함하고, 상기 주변 잡음 트리거 레벨 임계값 및 상기 위치에 대한 상기 분석의 시간의 저장을 유발하는 단계를 더 포함한다. 예 15는 예 13의 방법을 포함하고, 상기 오디오 프로세서 또는 다른 프로세서가 음성 명령을 검출하도록 고성능 상태 또는 고전력 소비 상태에 들어가게 하는 단계를 더 포함한다. 예 16은 예 13의 방법을 포함하고, 음성 명령의 비검출에 응답하여 상기 오디오 프로세서 또는 다른 프로세서가 저성능 상태 또는 저전력 소비 상태에 머물게 하는 단계를 더 포함한다. 예 17은 예 13의 방법을 포함하고, 하나 이상의 센서가 상기 오디오 프로세서의 상기 위치를 나타내는 데이터를 검출하게 하는 단계를 더 포함한다. 예 18은 예 13의 방법을 포함하고, 상기 위치에 대한 상기 저장된 주변 잡음 트리거 레벨 임계값을 복수의 컴퓨팅 디바이스 사이에서 공유하는 단계를 더 포함한다. 예 19는 예 18의 방법을 포함하고, 상기 복수의 컴퓨팅 디바이스의 동일한 컴퓨터 네트워크에 대한 결합을 유발하는 단계를 더 포함한다. 예 20은 예 13의 방법을 포함하고, 상기 위치에서의 상기 오디오 프로세서의 검출을 주기적 웨이크 상태들과 맞추는 단계를 더 포함한다. 예 21은 예 13의 방법을 포함하고, 상기 위치에서의 상기 오디오 프로세서의 상기 검출이 얼마나 자주 발생할지를 동적으로 조정하는 단계를 더 포함한다. 예 22는 예 13의 방법을 포함하고, 상기 위치에 대한 상기 주변 잡음 트리거 레벨 분석의 수행 후에 발생하는 거짓 트리거에 기초하여 상기 위치에 대한 상기 주변 잡음 트리거 레벨 임계값을 조정하는 단계를 더 포함한다.
예 23은 프로세서 상에서 실행될 때 예 13 내지 22 중 어느 한 예의 하나 이상의 동작을 수행하도록 상기 프로세서를 구성하는 하나 이상의 명령어를 포함하는 컴퓨터 판독 가능 매체를 포함한다.
예 24는 예 13 내지 22 중 어느 한 예의 방법을 수행하기 위한 수단을 포함하는 장치를 포함한다.
예 25는 하나 이상의 명령어를 저장하기 위한 메모리; 상기 하나 이상의 명령어를 실행하기 위한 오디오 프로세서; 위치에 대한 주변 잡음 트리거 레벨 분석을 수행하고, 상기 주변 잡음 트리거 레벨 분석에 기초하는 상기 위치에 대한 주변 잡음 트리거 레벨 임계값의 저장을 유발하기 위한 로직을 포함하고, 상기 로직은 적어도 부분적으로는 하드웨어 로직을 포함하고, 로직은 상기 위치에서의 상기 오디오 프로세서의 검출 및 상기 위치에서의 검출된 사운드 레벨과 상기 저장된 주변 잡음 트리거 레벨 임계값의 비교에 응답하여 상기 오디오 프로세서의 상태에 대한 변경을 유발할지를 결정하는 시스템을 포함한다. 예 26은 예 25의 시스템을 포함하고, 상기 위치에 대한 주변 잡음 트리거 레벨 분석을 수행하기 위한 로직은 상기 주변 잡음 트리거 레벨 임계값 및 상기 위치에 대한 상기 분석의 시간의 저장을 유발한다. 예 27은 예 25의 시스템을 포함하고, 상기 오디오 프로세서의 상기 상태에 대한 변경을 유발하기 위한 로직은 상기 오디오 프로세서 또는 다른 프로세서가 음성 명령을 검출하도록 고성능 상태 또는 고전력 소비 상태에 들어가게 한다. 예 28은 예 25의 시스템을 포함하고, 상기 오디오 프로세서의 상기 상태에 대한 변경을 유발하기 위한 로직은 음성 명령의 비검출에 응답하여 상기 오디오 프로세서 또는 다른 프로세서가 저전력 소비 상태 또는 저성능 상태에 머물게 한다. 예 29는 예 25의 시스템을 포함하고, 하나 이상의 센서가 상기 오디오 프로세서의 상기 위치를 나타내는 데이터를 검출한다. 예 30은 예 25의 시스템을 포함하고, 상기 위치에 대한 상기 저장된 주변 잡음 트리거 레벨 임계값은 복수의 컴퓨팅 디바이스 사이에서 공유된다. 예 31은 예 30의 시스템을 포함하고, 상기 복수의 컴퓨팅 디바이스는 동일한 컴퓨터 네트워크에 결합된다. 예 32는 예 25의 시스템을 포함하고, 상기 위치에서의 상기 오디오 프로세서의 검출은 주기적 웨이크 상태들과 맞춰진다. 예 33은 예 25의 시스템을 포함하고, 상기 위치에서의 상기 오디오 프로세서의 상기 검출이 얼마나 자주 발생할지가 동적으로 조정된다. 예 34는 예 25의 시스템을 포함하고, 상기 위치에 대한 상기 주변 잡음 트리거 레벨 분석의 수행 후에 발생하는 거짓 트리거에 기초하여 상기 위치에 대한 상기 주변 잡음 트리거 레벨 임계값을 조정하기 위한 로직을 더 포함한다. 예 35는 예 25의 시스템을 포함하고, 하나 이상의 프로세서 코어를 갖는 프로세서가 상기 분석을 수행하기 위한 상기 로직을 포함한다. 예 36은 예 25 내지 35 중 어느 한 예의 시스템을 포함하고, 상기 분석을 수행하기 위한 상기 로직, 하나 이상의 프로세서 코어 및 상기 메모리 중 하나 이상이 단일 집적 회로 다이 상에 존재한다.
예 37은 임의의 전술한 예에서 설명된 바와 같은 방법을 수행하기 위한 수단을 포함하는 장치를 포함한다.
예 38은 실행될 때 임의의 전술한 예에서 설명된 바와 같은 방법을 구현하거나 장치를 실현하기 위한 기계 판독 가능 명령어들을 포함하는 기계 판독 가능 저장소를 포함한다.
다양한 실시예들에서, 예로서 도 1-6과 관련하여 본 명세서에서 설명된 동작들은 하드웨어(예로서, 로직 회로), 소프트웨어, 펌웨어, 또는 예로서 본 명세서에서 설명되는 프로세스를 수행하도록 컴퓨터를 프로그래밍하는 데 사용되는 명령어들(또는 소프트웨어 절차들)을 저장하는 유형적인(예로서, 비일시적인) 기계 판독 가능 또는 컴퓨터 판독 가능 매체를 포함하는 컴퓨터 프로그램 제품으로서 제공될 수 있는 그들의 조합들로서 구현될 수 있다. 기계 판독 가능 매체는 도 1-6과 관련하여 설명된 것들과 같은 저장 디바이스를 포함할 수 있다.
게다가, 그러한 컴퓨터 판독 가능 매체는 컴퓨터 프로그램 제품으로서 다운로드될 수 있으며, 프로그램은 통신 링크(예로서, 버스, 모뎀 또는 네트워크 접속)를 통해 반송파 또는 다른 전파 매체 내에서 제공되는 데이터 신호들을 통해 원격 컴퓨터(예로서, 서버)로부터 요청 컴퓨터(예로서, 클라이언트)로 전송될 수 있다.
본 명세서에서 "하나의 실시예" 또는 "일 실시예"라는 표현은 실시예와 관련하여 설명된 특정한 특징, 구조, 및/또는 특성이 적어도 하나의 구현에 포함될 수 있는 것을 의미한다. 본 명세서의 여러 곳에서 나오는 "일 실시예에서"라는 표현들이 모두가 동일한 실시예를 말하는 것이거나 그렇지 않을 수 있다.
또한, 명세서 및 청구범위에서는 용어 "결합" 및 "접속"이 이들의 파생어들과 함께 사용될 수 있다. 일부 실시예들에서, "접속"은 2개 이상의 요소가 서로 물리적으로 또는 전기적으로 직접 접촉한다는 것을 지시하는 데 사용될 수 있다. "결합"은 2개 이상의 요소가 직접적인 물리적 또는 전기적 접촉을 하고 있는 것을 의미할 수 있다. 그러나, "결합"은 또한 2개 이상의 요소가 서로 직접 접촉하고 있지 않을 수 있지만 여전히 서로 협력하거나 상호작용할 수 있는 것도 의미할 수 있다.
따라서, 실시예들은 구조적 특징들 및/또는 방법론적 동작들에 대한 특정 언어로 설명되었지만, 청구 대상은 설명된 특정 특징들 또는 동작들에 제한되지는 않을 수 있다는 것이 이해되어야 한다. 오히려, 특정의 특징 및 동작은 청구된 발명 대상을 구현하는 샘플 형태로서 개시된다.

Claims (24)

  1. 장치로서,
    하드웨어 로직을 적어도 부분적으로 포함하는 로직
    을 포함하고, 상기 로직은 위치에 대한 주변 잡음 트리거 레벨 분석을 수행하고, 상기 주변 잡음 트리거 레벨 분석에 기초하는 상기 위치에 대한 주변 잡음 트리거 레벨 임계값의 저장을 유발하고,
    로직은 상기 위치에서의 오디오 프로세서의 검출 및 상기 위치에서의 검출된 사운드 레벨과 상기 저장된 주변 잡음 트리거 레벨 임계값의 비교에 응답하여 상기 오디오 프로세서의 상태에 대한 변경을 유발할지를 결정하는 장치.
  2. 제1항에 있어서,
    상기 위치에 대한 주변 잡음 트리거 레벨 분석을 수행하는 로직은, 상기 주변 잡음 트리거 레벨 임계값 및 상기 위치에 대한 상기 분석의 시간의 저장을 유발하는 장치.
  3. 제1항에 있어서,
    상기 오디오 프로세서의 상태에 대한 변경을 유발하기 위한 로직은 상기 오디오 프로세서 또는 다른 프로세서가 음성 명령을 검출하도록 고성능 상태 또는 고전력 소비 상태에 들어가게 하는 장치.
  4. 제1항에 있어서,
    상기 오디오 프로세서의 상태에 대한 변경을 유발하는 로직은 음성 명령의 비검출에 응답하여 상기 오디오 프로세서 또는 다른 프로세서가 저전력 소비 상태 또는 저성능 상태에 머물게 하는 장치.
  5. 제1항에 있어서,
    하나 이상의 센서가 상기 오디오 프로세서의 상기 위치를 나타내는 데이터를 검출하는 장치.
  6. 제1항에 있어서,
    상기 위치에 대한 상기 저장된 주변 잡음 트리거 레벨 임계값은 복수의 컴퓨팅 디바이스 사이에서 공유되는 장치.
  7. 제6항에 있어서,
    상기 복수의 컴퓨팅 디바이스는 동일한 컴퓨터 네트워크에 결합되는 장치.
  8. 제1항에 있어서,
    상기 위치에서의 상기 오디오 프로세서의 검출은 주기적 웨이크 상태(periodic wake state)들과 맞춰지는(aligned) 장치.
  9. 제1항에 있어서,
    상기 위치에서의 상기 오디오 프로세서의 상기 검출이 얼마나 자주 발생할지가 동적으로 조정되는 장치.
  10. 제1항에 있어서,
    상기 위치에 대한 상기 주변 잡음 트리거 레벨 분석의 수행 후에 발생하는 거짓 트리거에 기초하여 상기 위치에 대한 상기 주변 잡음 트리거 레벨 임계값을 조정하기 위한 로직을 더 포함하는 장치.
  11. 제1항에 있어서,
    하나 이상의 프로세서 코어를 갖는 프로세서가 상기 분석을 수행하기 위한 상기 로직을 포함하는 장치.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서,
    상기 분석을 수행하기 위한 로직, 하나 이상의 프로세서 코어 및 메모리 중 하나 이상이 단일 집적 회로 다이 상에 존재하는 장치.
  13. 위치에 대한 주변 잡음 트리거 레벨 분석을 수행하고, 상기 주변 잡음 트리거 레벨 분석에 기초하는 상기 위치에 대한 주변 잡음 트리거 레벨 임계값의 저장을 유발하는 단계; 및
    상기 위치에서의 오디오 프로세서의 검출 및 상기 위치에서의 검출된 사운드 레벨과 상기 저장된 주변 잡음 트리거 레벨 임계값의 비교에 응답하여 상기 오디오 프로세서의 상태에 대한 변경을 유발할지를 결정하는 단계
    를 포함하는 방법.
  14. 제13항에 있어서,
    상기 주변 잡음 트리거 레벨 임계값 및 상기 위치에 대한 상기 분석의 시간의 저장을 유발하는 단계를 더 포함하는 방법.
  15. 제13항에 있어서,
    상기 오디오 프로세서 또는 다른 프로세서가 음성 명령을 검출하도록 고성능 상태 또는 고전력 소비 상태에 들어가게 하는 단계를 더 포함하는 방법.
  16. 제13항에 있어서,
    음성 명령의 비검출에 응답하여 상기 오디오 프로세서 또는 다른 프로세서가 저성능 상태 또는 저전력 소비 상태에 머물게 하는 단계를 더 포함하는 방법.
  17. 제13항에 있어서,
    하나 이상의 센서가 상기 오디오 프로세서의 상기 위치를 나타내는 데이터를 검출하게 하는 단계를 더 포함하는 방법.
  18. 제13항에 있어서,
    상기 위치에 대한 상기 저장된 주변 잡음 트리거 레벨 임계값을 복수의 컴퓨팅 디바이스 사이에서 공유하는 단계를 더 포함하는 방법.
  19. 제18항에 있어서,
    상기 복수의 컴퓨팅 디바이스의 동일한 컴퓨터 네트워크에 대한 결합을 유발하는 단계를 더 포함하는 방법.
  20. 제13항에 있어서,
    상기 위치에서의 상기 오디오 프로세서의 검출을 주기적 웨이크 상태들과 맞추는 단계를 더 포함하는 방법.
  21. 제13항에 있어서,
    상기 위치에서의 상기 오디오 프로세서의 상기 검출이 얼마나 자주 발생할지를 동적으로 조정하는 단계를 더 포함하는 방법.
  22. 제13항에 있어서,
    상기 위치에 대한 상기 주변 잡음 트리거 레벨 분석의 수행 후에 발생하는 거짓 트리거에 기초하여 상기 위치에 대한 상기 주변 잡음 트리거 레벨 임계값을 조정하는 단계를 더 포함하는 방법.
  23. 프로세서 상에서 실행될 때 제13항 내지 제22항 중 어느 한 항의 하나 이상의 동작을 수행하도록 상기 프로세서를 구성하는 하나 이상의 명령어를 포함하는 컴퓨터 판독 가능 매체.
  24. 제13항 내지 제22항 중 어느 한 항의 방법을 수행하기 위한 수단을 포함하는 장치.
KR1020167023360A 2014-03-31 2014-03-31 항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴 KR102018152B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/074363 WO2015149216A1 (en) 2014-03-31 2014-03-31 Location aware power management scheme for always-on- always-listen voice recognition system

Publications (2)

Publication Number Publication Date
KR20160113255A true KR20160113255A (ko) 2016-09-28
KR102018152B1 KR102018152B1 (ko) 2019-09-04

Family

ID=54239210

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167023360A KR102018152B1 (ko) 2014-03-31 2014-03-31 항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴

Country Status (5)

Country Link
US (1) US10133332B2 (ko)
EP (1) EP3126929B1 (ko)
KR (1) KR102018152B1 (ko)
CN (1) CN106062661B (ko)
WO (1) WO2015149216A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10133332B2 (en) 2014-03-31 2018-11-20 Intel Corporation Location aware power management scheme for always-on-always-listen voice recognition system
KR20190100270A (ko) * 2016-12-21 2019-08-28 아브네라 코포레이션 저-전력, 상시-청취, 음성-커맨드 검출 및 캡처
WO2024053762A1 (ko) * 2022-09-08 2024-03-14 엘지전자 주식회사 음성 인식 장치 및 그의 동작 방법

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9516165B1 (en) * 2014-03-26 2016-12-06 West Corporation IVR engagements and upfront background noise
US11874716B2 (en) 2015-08-05 2024-01-16 Suunto Oy Embedded computing device management
US11210299B2 (en) 2015-12-01 2021-12-28 Amer Sports Digital Services Oy Apparatus and method for presenting thematic maps
US11144107B2 (en) 2015-12-01 2021-10-12 Amer Sports Digital Services Oy Apparatus and method for presenting thematic maps
US11215457B2 (en) 2015-12-01 2022-01-04 Amer Sports Digital Services Oy Thematic map based route optimization
US11137820B2 (en) 2015-12-01 2021-10-05 Amer Sports Digital Services Oy Apparatus and method for presenting thematic maps
US11587484B2 (en) 2015-12-21 2023-02-21 Suunto Oy Method for controlling a display
US11284807B2 (en) 2015-12-21 2022-03-29 Amer Sports Digital Services Oy Engaging exercising devices with a mobile device
US11541280B2 (en) 2015-12-21 2023-01-03 Suunto Oy Apparatus and exercising device
US11838990B2 (en) 2015-12-21 2023-12-05 Suunto Oy Communicating sensor data in wireless communication systems
FI127926B (en) 2015-12-21 2019-05-31 Suunto Oy Sensor-based context management
BR112018015313B1 (pt) 2016-04-11 2022-11-01 Hewlett-Packard Development Company, L.P. Método, mídia de armazenamento não transitório legível por computador e dispositivo de computação
US10880833B2 (en) * 2016-04-25 2020-12-29 Sensory, Incorporated Smart listening modes supporting quasi always-on listening
US20180025731A1 (en) * 2016-07-21 2018-01-25 Andrew Lovitt Cascading Specialized Recognition Engines Based on a Recognition Policy
US11703938B2 (en) 2016-10-17 2023-07-18 Suunto Oy Embedded computing device
DE102017009171A1 (de) 2016-10-17 2018-04-19 Amer Sports Digital Services Oy Eingebettete rechenvorrichtung
WO2018118744A1 (en) * 2016-12-19 2018-06-28 Knowles Electronics, Llc Methods and systems for reducing false alarms in keyword detection
CN108447472B (zh) * 2017-02-16 2022-04-05 腾讯科技(深圳)有限公司 语音唤醒方法及装置
CN108536413B (zh) * 2017-03-06 2021-03-26 北京君正集成电路股份有限公司 一种音频数据采集方法及设备
CN108536412B (zh) * 2017-03-06 2021-01-08 北京君正集成电路股份有限公司 一种音频数据采集方法及设备
US10748531B2 (en) * 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
US10930276B2 (en) * 2017-07-12 2021-02-23 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US11489691B2 (en) 2017-07-12 2022-11-01 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US10171054B1 (en) * 2017-08-24 2019-01-01 International Business Machines Corporation Audio adjustment based on dynamic and static rules
EP3735687A4 (en) * 2018-01-03 2021-10-27 Universal Electronics, Inc. DEVICE, SYSTEM AND PROCEDURE FOR CONDUCTING VOICE INPUT IN A CONTROL DEVICE
KR102629385B1 (ko) * 2018-01-25 2024-01-25 삼성전자주식회사 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법
KR102530391B1 (ko) * 2018-01-25 2023-05-09 삼성전자주식회사 외부 인터럽트를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법
KR102459920B1 (ko) * 2018-01-25 2022-10-27 삼성전자주식회사 저전력 에코 제거를 지원하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법
KR102453656B1 (ko) * 2018-01-25 2022-10-12 삼성전자주식회사 저전력 동작을 위한 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법
US10332543B1 (en) 2018-03-12 2019-06-25 Cypress Semiconductor Corporation Systems and methods for capturing noise for pattern recognition processing
CN109218899A (zh) * 2018-08-29 2019-01-15 出门问问信息科技有限公司 一种语音交互场景的识别方法、装置及智能音箱
CN109243447A (zh) * 2018-10-12 2019-01-18 西安蜂语信息科技有限公司 语音发送触发方法及装置
CN109671426B (zh) * 2018-12-06 2021-01-29 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及空调
US11232788B2 (en) * 2018-12-10 2022-01-25 Amazon Technologies, Inc. Wakeword detection
TWI736045B (zh) * 2018-12-18 2021-08-11 芬蘭商亞瑪芬體育數字服務公司 嵌入式計算裝置管理
US11012780B2 (en) * 2019-05-14 2021-05-18 Bose Corporation Speaker system with customized audio experiences
US20210005181A1 (en) * 2019-06-10 2021-01-07 Knowles Electronics, Llc Audible keyword detection and method
CN111028831B (zh) * 2019-11-11 2022-02-18 云知声智能科技股份有限公司 一种语音唤醒方法及装置
US11967322B2 (en) 2021-05-06 2024-04-23 Samsung Electronics Co., Ltd. Server for identifying false wakeup and method for controlling the same
KR20220151504A (ko) * 2021-05-06 2022-11-15 삼성전자주식회사 오호출을 식별하는 서버 및 이의 제어 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187931A1 (en) * 2002-03-29 2003-10-02 Olsen Gregory P. Facilitating resource access using prioritized multicast responses to a discovery request
US20040138877A1 (en) * 2002-12-27 2004-07-15 Kabushiki Kaisha Toshiba Speech input apparatus and method
US20130223635A1 (en) * 2012-02-27 2013-08-29 Cambridge Silicon Radio Limited Low power audio detection
JP2013171462A (ja) * 2012-02-21 2013-09-02 Nippon Hoso Kyokai <Nhk> フレーズ検出装置およびそのプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127540B (zh) 2006-08-15 2011-03-16 大唐移动通信设备有限公司 一种功率控制方法及装置
US8639516B2 (en) * 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US8359020B2 (en) 2010-08-06 2013-01-22 Google Inc. Automatically monitoring for voice input based on context
EP2639793B1 (en) 2012-03-15 2016-04-20 Samsung Electronics Co., Ltd Electronic device and method for controlling power using voice recognition
US9142215B2 (en) 2012-06-15 2015-09-22 Cypress Semiconductor Corporation Power-efficient voice activation
EP2875682A4 (en) * 2012-07-17 2015-12-30 Intertrust Tech Corp PORTABLE RESOURCE MANAGEMENT SYSTEMS AND METHOD
US9063731B2 (en) * 2012-08-27 2015-06-23 Samsung Electronics Co., Ltd. Ultra low power apparatus and method to wake up a main processor
US20140122078A1 (en) * 2012-11-01 2014-05-01 3iLogic-Designs Private Limited Low Power Mechanism for Keyword Based Hands-Free Wake Up in Always ON-Domain
US9240182B2 (en) * 2013-09-17 2016-01-19 Qualcomm Incorporated Method and apparatus for adjusting detection threshold for activating voice assistant function
KR102018152B1 (ko) 2014-03-31 2019-09-04 인텔 코포레이션 항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187931A1 (en) * 2002-03-29 2003-10-02 Olsen Gregory P. Facilitating resource access using prioritized multicast responses to a discovery request
US20040138877A1 (en) * 2002-12-27 2004-07-15 Kabushiki Kaisha Toshiba Speech input apparatus and method
JP2013171462A (ja) * 2012-02-21 2013-09-02 Nippon Hoso Kyokai <Nhk> フレーズ検出装置およびそのプログラム
US20130223635A1 (en) * 2012-02-27 2013-08-29 Cambridge Silicon Radio Limited Low power audio detection

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10133332B2 (en) 2014-03-31 2018-11-20 Intel Corporation Location aware power management scheme for always-on-always-listen voice recognition system
KR20190100270A (ko) * 2016-12-21 2019-08-28 아브네라 코포레이션 저-전력, 상시-청취, 음성-커맨드 검출 및 캡처
WO2024053762A1 (ko) * 2022-09-08 2024-03-14 엘지전자 주식회사 음성 인식 장치 및 그의 동작 방법

Also Published As

Publication number Publication date
KR102018152B1 (ko) 2019-09-04
EP3126929A1 (en) 2017-02-08
CN106062661B (zh) 2021-09-07
CN106062661A (zh) 2016-10-26
US20170031420A1 (en) 2017-02-02
EP3126929B1 (en) 2020-11-18
WO2015149216A1 (en) 2015-10-08
EP3126929A4 (en) 2017-11-22
US10133332B2 (en) 2018-11-20

Similar Documents

Publication Publication Date Title
KR102018152B1 (ko) 항상-온-항상-청취 음성 인식 시스템을 위한 위치 인식 전력 관리 스킴
US9852731B2 (en) Mechanism and apparatus for seamless voice wake and speaker verification
KR101821639B1 (ko) 지능형 보조 전자 디바이스
US10621992B2 (en) Activating voice assistant based on at least one of user proximity and context
US11031005B2 (en) Continuous topic detection and adaption in audio environments
KR20180083587A (ko) 전자 장치 및 그의 동작 방법
KR101722042B1 (ko) 전력 효율적 로케이션 통지
TW202206975A (zh) 具機器學習之低功率環境計算系統
US9568977B2 (en) Context sensing for computing devices
US20140351560A1 (en) Low Power Management of Multiple Sensor Integrated Chip Architecture
JP6955092B2 (ja) 端末の電力消費を低減するための方法、および端末
US20140279786A1 (en) Application-controlled granularity for power-efficient classification
US9247572B2 (en) Intelligent wireless charging device
JP7272694B2 (ja) 端末の電力消費を低減するための方法、および端末
WO2016048572A1 (en) Location based haptic direction finding
JP7190982B2 (ja) 音声ベースのメカニズムに基づくスマート表示装置のディスプレイ停止の方法及びシステム
US9575551B2 (en) GNSS services on low power hub
US20150187388A1 (en) Intelligent recording in electronic devices
US11029741B2 (en) Deactivating a display of a smart display device based on a vision-based mechanism
US20220408216A1 (en) Tracking Proximities of Devices and/or Objects
US11416213B2 (en) Electronic device for obtaining and entering lacking parameter
US20150189072A1 (en) Intelligent ancillary electronic device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right