KR20200063095A - 멀티 빔 선택 방법 및 장치 - Google Patents

멀티 빔 선택 방법 및 장치 Download PDF

Info

Publication number
KR20200063095A
KR20200063095A KR1020197017626A KR20197017626A KR20200063095A KR 20200063095 A KR20200063095 A KR 20200063095A KR 1020197017626 A KR1020197017626 A KR 1020197017626A KR 20197017626 A KR20197017626 A KR 20197017626A KR 20200063095 A KR20200063095 A KR 20200063095A
Authority
KR
South Korea
Prior art keywords
beam data
data
frequency correlation
correlation coefficients
sum
Prior art date
Application number
KR1020197017626A
Other languages
English (en)
Other versions
KR102240490B1 (ko
Inventor
죵량 리
Original Assignee
베이징 시아오미 인텔리전트 테크놀로지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 시아오미 인텔리전트 테크놀로지 컴퍼니 리미티드 filed Critical 베이징 시아오미 인텔리전트 테크놀로지 컴퍼니 리미티드
Publication of KR20200063095A publication Critical patent/KR20200063095A/ko
Application granted granted Critical
Publication of KR102240490B1 publication Critical patent/KR102240490B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/48Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
    • G01S7/491Details of non-pulse systems
    • G01S7/4911Transmitters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W56/00Synchronisation arrangements
    • H04W56/0055Synchronisation arrangements determining timing error of reception due to propagation delay
    • H04W56/0065Synchronisation arrangements determining timing error of reception due to propagation delay using measurement of signal travel time
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/48Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
    • G01S7/483Details of pulse systems
    • G01S7/484Transmitters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/0408Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas using two or more beams, i.e. beam diversity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0613Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
    • H04B7/0615Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
    • H04B7/0617Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal for beam forming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0686Hybrid systems, i.e. switching and simultaneous transmission
    • H04B7/0695Hybrid systems, i.e. switching and simultaneous transmission using beam selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/26Systems using multi-frequency codes
    • H04L27/2601Multicarrier modulation systems
    • H04L27/2647Arrangements specific to the receiver only
    • H04L27/2655Synchronisation arrangements
    • H04L27/2657Carrier synchronisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/26Systems using multi-frequency codes
    • H04L27/2601Multicarrier modulation systems
    • H04L27/2647Arrangements specific to the receiver only
    • H04L27/2655Synchronisation arrangements
    • H04L27/2666Acquisition of further OFDM parameters, e.g. bandwidth, subcarrier spacing, or guard interval length
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Radar, Positioning & Navigation (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

본 개시는 멀티 빔 선택 방법 및 장치에 관한 것이다. 당해 방법은, 복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하는 단계, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하는 단계, 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계, 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계를 포함한다. 당해 기술안은 웨이크업 워드 검출 속도에 영향 주지 않는 전제하에 웨이크업 워드 검출하는데 필요한 처리 자원을 감소하고 웨이크업 워드 검출하는 컴퓨팅 기기의 컴퓨팅 능력에 대한 요구를 낮춤으로써 당해 컴퓨팅 기기의 제조 비용을 낮추고 사용자 체험을 개선할 수 있다.

Description

멀티 빔 선택 방법 및 장치
본 개시는 디지털 신호 처리 기술 분야에 관한 것으로, 특히 멀티 빔 선택 방법 및 장치에 관한 것이다.
인공 지능 기술의 신속한 발전에 따라, 스마트 홈 기기의 응용이 점점 광범위해지고 있다. 스마트 홈 기기에는 일반적으로 복수의 소리 수집 모듈을 포함하는 마이크로폰 어레이가 설치되어 있고, 당해 마이크로폰 어레이를 통해 소리 신호를 수집하고, 수집된 소리 신호에 따라 빔 형성을 진행하여 복수의 각각 부동한 방향에 대응하는 빔 데이터를 획득하고 이로써 복수의 빔 데이터에서 웨이크업 워드 검출하고 빔 데이터 중에 설정된 키워드가 포함된 것을 검출한 뒤 스마트 홈 기기를 웨이크업할 수 있다. 관련 기술에서는, 스마트 홈 기기를 웨이크업하는 속도를 가속화하기 위해, 당해 복수의 빔 데이터에 대해 병렬로 각각 웨이크업 워드 검출을 진행할 수 있다.
비록 상술한 기술안은 스마트 홈 기기를 웨이크업하는 속도를 가속화할 수 있으나, 병렬로 웨이크업 워드 검출하는 것은 보다 많은 처리 자원의 소모가 필요하므로 스마트 홈 기기의 컴퓨팅 능력에 대한 요구가 비교적 높고, 이로써 스마트 홈 기기의 제조 비용이 높아지고, 사용자 체험에 손색이 있다.
관련 기술에 존재하는 문제를 극복하기 위하여, 본 개시의 실시예는 멀티 빔 선택 방법 및 장치를 제공하는바, 기술안은 이하와 같다.
본 개시의 실시예의 제1 측면에 의하면, 멀티 빔 선택 방법을 제공하는바,
복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하는 단계,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하는 단계 - 빔 주파수 상관 계수는 복수의 빔 데이터 중 하나의 빔 데이터와 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것임 -,
복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계, 및
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계를 포함한다.
본 개시의 실시예에 의해 제공되는 기술안에서는, 복수의 빔 데이터를 획득하고 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하고, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하고, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하므로, 상술한 기술안은, 소리 소스가 발생하는 소리에 웨이크업 워드가 포함될 시 복수의 빔 데이터 중의 목표 빔 데이터 중에서 성공적으로 웨이크업 워드를 검출하는 확률이 보다 높기 때문에, 복수의 빔 데이터를 획득할 시 전체 빔 데이터에 대해 웨이크업 워드 검출을 진행할 필요 없이 목표 빔 데이터에 대해서만 웨이크업 워드 검출을 진행하면 되므로, 웨이크업 워드 검출 속도에 영향 주지 않는 전제하에 웨이크업 워드 검출하는데 필요한 처리 자원을 감소하고 웨이크업 워드 검출하는 컴퓨팅 기기의 컴퓨팅 능력에 대한 요구를 낮춤으로써 당해 컴퓨팅 기기의 제조 비용을 낮추고 사용자 체험을 개선한다.
한 실시예에서, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하는 단계는,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고 각각의 빔 주파수 상관 계수를 정규화 처리하는 단계를 포함하고,
복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계는,
정규화 처리된 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계를 포함한다.
한 실시예에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계는,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터, 또는 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최소인 빔 데이터를, 목표 빔 데이터로 선택하는 단계를 포함한다.
한 실시예에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계는,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하는 단계,
후보 빔 데이터의 에너지 값을 획득하는 단계, 및
후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시, 후보 빔 데이터를 목표 빔 데이터로 선택하는 단계를 포함한다.
한 실시예에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계는,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하는 단계,
후보 빔 수집 방향을 결정하는 단계 - 후보 빔 수집 방향은 후보 빔 데이터를 수집하는 소리 수집 모듈이 향하는 방향임 -,
복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정하는 단계 - 소리 소스 방향은 소리 수집 모듈에서 소리 소스를 지향하는 방향임 -, 및
후보 빔 수집 방향과 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 후보 빔 데이터를 목표 빔 데이터로 선택하는 단계를 포함한다.
본 개시의 실시예의 제2 측면에 따르면, 멀티 빔 선택 장치를 제공하는바,
복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하기 위한 빔 데이터 획득 모듈,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하기 위한 빔 주파수 상관 계수 획득 모듈 - 빔 주파수 상관 계수는 복수의 빔 데이터 중 하나의 빔 데이터와 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것임 -,
복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하기 위한 빔 주파수 상관 계수 합 획득 모듈, 및
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하기 위한목표 빔 데이터 선택 모듈을 포함한다.
한 실시예에서, 빔 주파수 상관 계수 획득 모듈은,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고 각각의 빔 주파수 상관 계수를 정규화 처리하기 위한 정규화 처리 서브 모듈을 포함하고,
빔 주파수 상관 계수 합 획득 모듈은,
정규화 처리된 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하기 위한 빔 주파수 상관 계수 합 획득 서브 모듈을 포함한다.
한 실시예에서, 목표 빔 데이터 선택 모듈은,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터, 또는 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최소인 빔 데이터를, 목표 빔 데이터로 선택하기 위한 제1 목표 빔 데이터 선택 서브 모듈을 포함한다.
한 실시예에서, 목표 빔 데이터 선택 모듈은,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하기 위한 제1 후보 빔 데이터 선택 서브 모듈,
후보 빔 데이터의 에너지 값을 획득하기 위한 에너지 값 획득 서브 모듈, 및
후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시, 후보 빔 데이터를 목표 빔 데이터로 선택하기 위한 제2 목표 빔 데이터 선택 서브 모듈을 포함한다.
한 실시예에서, 목표 빔 데이터 선택 모듈은,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하기 위한 제1 후보 빔 데이터 선택 서브 모듈,
후보 빔 수집 방향을 결정하기 위한 후보 빔 수집 방향 결정 서브 모듈 - 후보 빔 수집 방향은 후보 빔 데이터를 수집하는 소리 수집 모듈이 향하는 방향임 -,
복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정하기 위한 소리 소스 방향 결정 서브 모듈 - 소리 소스 방향은 소리 수집 모듈에서 소리 소스를 지향하는 방향임 -, 및
후보 빔 수집 방향과 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 후보 빔 데이터를 목표 빔 데이터로 선택하기 위한 제3 목표 빔 데이터 선택 서브 모듈을 포함한다.
본 개시의 실시예의 제3 측면에 따르면, 멀티 빔 선택 장치를 제공하는바, 이는,
프로세서, 및
프로세서에 의해 실행 가능한 명령을 저장하기 위한 메모리를 포함하고,
프로세서는,
복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하고,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고 - 빔 주파수 상관 계수는 복수의 빔 데이터 중 하나의 빔 데이터와 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것임 -,
복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하고,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하도록 구성된다.
본 개시의 실시예의 제4 측면에 따르면, 컴퓨터 명령이 저장되어 있는 컴퓨터 판독 가능 저장 매체를 제공하고, 당해 명령이 프로세서에 의해 실행될 시 본 개시의 실시예의 제1 측면의 임의 한 항에 기술된 방법의 단계를 구현한다.
이상의 일반적인 설명과 후술의 디테일한 설명은 단지 예시적이고 해석적인 것으로 본 개시를 제한할 수 없음을 이해하여야 한다.
여기서 첨부 도면은 명세서에 병합되어 본 명세서의 일 부분을 구성하고 본 발명에 부합되는 실시예를 도시하며 명세서와 함께 본 발명의 원리를 해석하기 위한 것이다.
도 1은 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 방법의 응용 시나리오 도이다.
도 2a는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 방법의 개략적인 흐름도이다.
도 2b는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 방법의 개략적인 흐름도이다.
도 2c는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 방법의 개략적인 흐름도이다.
도 2d는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 방법의 개략적인 흐름도이다.
도 3은 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 방법의 개략적인 흐름도이다.
도 4a는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 장치의 개략적인 구조도이다.
도 4b는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 장치의 개략적인 구조도이다.
도 4c는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 장치의 개략적인 구조도이다.
도 4d는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 장치의 개략적인 구조도이다.
도 4e는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 장치의 개략적인 구조도이다.
도 5는 한 예시적인 실시예에 따라 도시한 장치의 블록도이다.
도 6은 한 예시적인 실시예에 따라 도시한 장치의 블록도이다.
여기서 예시적인 실시예에 대해 상세히 설명하고자 하는바, 그 예시는 첨부 도면에 표시되어 있다. 아래의 설명에서 첨부 도면을 언급할 시, 별도 표시가 없는 한, 부동한 첨부 도면에서 동일한 숫자는 동일하거나 유사한 요소를 표시한다. 이하 예시적인 실시예에서 설명하는 구현 방식은 본 개시에 일치되는 모든 구현 방식을 대표하는 것은 아니다. 반대로, 이는 단지 첨부된 특허청구범위에서 상세히 기술하는 바와 같은, 본 개시의 일부 측면과 일치되는 장치 및 방법의 예시일 뿐이다.
과학 기술이 고속히 발전함과 사람들 생활 수준이 부단히 높아짐에 따라, 최근에 인공 지능 기술이 신속히 발전하고 스마트 홈 기기의 응용이 점점 광범위해지고 있다.
스마트 홈 기기에는 일반적으로 복수의 소리 수집 모듈을 포함하는 마이크로폰 어레이가 설치되어 있고, 당해 마이크로폰 어레이를 통해 소리 신호를 수집하고, 수집된 소리 신호에 따라 빔 형성을 진행하여 복수의 각각 부동한 방향에 대응하는 빔 데이터를 획득하고 이로써 복수의 빔 데이터에서 웨이크업 워드 검출하고 빔 데이터 중에 설정된 키워드가 포함된 것을 검출한 뒤 스마트 홈 기기를 웨이크업할 수 있다. 관련 기술에서는, 스마트 홈 기기를 웨이크업하는 속도를 가속화하기 위해, 당해 복수의 빔 데이터에 대해 병렬로 각각 웨이크업 워드 검출을 진행할 수 있다.
비록 상술한 기술안은 스마트 홈 기기를 웨이크업하는 속도를 가속화할 수 있으나, 병렬로 웨이크업 워드 검출하는 것은 보다 많은 처리 자원의 소모가 필요하므로 스마트 홈 기기의 컴퓨팅 능력에 대한 요구가 비교적 높고, 이로써 스마트 홈 기기의 제조 비용이 높아지고, 사용자 체험에 손색이 있다.
상술한 문제를 해결하기 위해, 본 개시의 실시예에 의해 제공되는 기술안에서는, 복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하고, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하고, 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하므로, 상술한 기술안에서는, 소리 소스가 발생하는 소리에 웨이크업 워드가 포함될 시 복수의 빔 데이터 중의 목표 빔 데이터 중에서 성공적으로 웨이크업 워드를 검출하는 확률이 보다 높기 때문에, 복수의 빔 데이터를 획득할 시 전체 빔 데이터에 대해 웨이크업 워드 검출을 진행할 필요 없이 목표 빔 데이터에 대해서만 웨이크업 워드 검출을 진행하면 되므로, 웨이크업 워드 검출 속도에 영향 주지 않는 전제하에 웨이크업 워드 검출하는데 필요한 처리 자원을 감소하고 웨이크업 워드 검출하는 컴퓨팅 기기의 컴퓨팅 능력에 대한 요구를 낮춤으로써 당해 컴퓨팅 기기의 제조 비용을 낮추고 사용자 체험을 개선한다.
본 개시의 실시예에 의해 제공되는 기술안은, 도 1에 도시한 바와 같은 전자 기기(100)에 관한 것이고, 여기서 전자 기기(100)는 마이크로폰 어레이(101)를 포함하고, 마이크로폰 어레이(101)는 복수의 소리 수집 모듈(102)을 포함하고, 각각의 소리 수집 모듈(102)은 각각 전자 기기(100)를 중심으로 부동한 방향을 가리킨다.
본 개시의 실시예는 멀티 빔 선택 방법을 제공하는바, 도 2A에 도시한 바와 같이, 이하 단계 201 내지 단계 204를 포함한다.
단계 201에서, 복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링한다.
예시적으로, 복수의 빔 데이터는, 전자 기기를 중심으로 하는 공간이 복수의 구역으로 구분하고 각각의 구역이 하나의 빔 데이터에 대응되는 것으로 이해할 수 있다. 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하는 것은, 동일한 샘플링 구간에서 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링을 진행하되 획득한 주파수 샘플링 데이터는 복수의 주파수 값을 포함하는 것으로 이해할 수 있다.
단계 202에서, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득한다.
여기서, 빔 주파수 상관 계수는 복수의 빔 데이터 중 하나의 빔 데이터와 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것이다.
예시적으로, 복수의 빔 데이터 중의 임의 2개 빔 데이터에 대응되는 빔의 인덱스 번호가
Figure pct00001
Figure pct00002
이고,
Figure pct00003
는 빔의 인덱스 번호가
Figure pct00004
인 빔 데이터의 주파수 샘플링 값이고,
Figure pct00005
는 빔의 인덱스 번호가
Figure pct00006
인 빔 데이터의 주파수 샘플링 값이고, 이 2개 빔이 각각 대응하는 빔 데이터 사이의 빔 주파수 상관 계수
Figure pct00007
Figure pct00008
을 통해 획득할 수 있는 바, 여기서
Figure pct00009
Figure pct00010
의 공액전치이고, 빔 데이터 중에서 주파수 샘플링하는 주파수 포인트는 N개인바, 예하면, N은 2의 거듭제곱수일 수 있고, 예하면 N은 256과 같을 수 있다.
단계 203에서, 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득한다.
예시적으로, 복수의 빔 데이터가 L개 빔 데이터일 시, 당해 L개 빔 데이터 중의 임의 하나의 빔 데이터에 대응되는 빔 주파수 상관 계수 합은, 당해 빔 데이터와 기타 L-1 개 빔 데이터 중 매 하나 빔 데이터 사이의 빔 데이터의 빔 주파수 상관 계수를 더하는 것을 통해 획득하는 것, 즉 L-1개 빔 주파수 상관 계수를 더하여 획득하는 것으로 이해할 수 있다.
단계 204에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택한다.
예시적으로, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 것은, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터, 또는 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최소인 빔 데이터를, 목표 빔 데이터로 선택하는 것으로 이해할 수 있다.
본 개시의 실시예에 의해 제공되는 기술안에서는, 복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하고, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하고, 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하므로, 상술한 기술안에서는, 소리 소스가 발생하는 소리에 웨이크업 워드가 포함될 시 복수의 빔 데이터 중의 목표 빔 데이터 중에서 성공적으로 웨이크업 워드를 검출하는 확률이 보다 높기 때문에, 복수의 빔 데이터를 획득할 시 전체 빔 데이터에 대해 웨이크업 워드 검출을 진행할 필요 없이 목표 빔 데이터에 대해서만 웨이크업 워드 검출을 진행하면 되므로, 웨이크업 워드 검출 속도에 영향 주지 않는 전제하에 웨이크업 워드 검출하는데 필요한 처리 자원을 감소하고 웨이크업 워드 검출하는 컴퓨팅 기기의 컴퓨팅 능력에 대한 요구를 낮춤으로써 당해 컴퓨팅 기기의 제조 비용을 낮추고 사용자 체험을 개선한다.
한 실시예에서, 도 2B에 도시한 바와 같이, 단계 202에서, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하는 것은, 단계 2021을 통해 구현할 수 있는 바,
단계 2021에서, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고 각각의 빔 주파수 상관 계수를 정규화 처리한다.
예시적으로, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고 각각의 빔 주파수 상관 계수를 정규화 처리하는 것은,
Figure pct00011
을 통해 빔 주파수 상관 계수
Figure pct00012
를 획득하고, 여기서 복수의 빔 데이터 중의 2개 빔 데이터에 대응되는 빔의 인덱스 번호가
Figure pct00013
Figure pct00014
이고,
Figure pct00015
는 빔의 인덱스 번호가
Figure pct00016
인 빔 데이터의 주파수 샘플링 값이고,
Figure pct00017
는 빔의 인덱스 번호가
Figure pct00018
인 빔 데이터의 주파수 샘플링 값이고,
Figure pct00019
Figure pct00020
의 공액전치이고, 빔 데이터 중에서 주파수 샘플링하는 주파수 포인트가 N개인 것으로 이해할 수 있다.
단계 203에서, 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 것은, 단계 2031을 통해 구현할 수 있는 바,
단계 2031에서, 정규화 처리된 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득한다.
정규화 처리된 복수의 빔 주파수 상관 계수를 획득하고 정규화 처리된 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 것을 통해, 주파수 샘플링 데이터 중에서 주파수 폭이 빔 주파수 상관 계수 합에 대한 영향을 낮출 수 있고, 웨이크업 워드 검출 진행 시의 성공률을 상승시킨다.
한 실시예에서, 도 2c에 도시한 바와 같이, 단계 204에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 것은, 단계 2041 내지 단계 2043을 통해 구현할 수 있는 바,
단계 2041에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택한다.
단계 2042에서, 후보 빔 데이터의 에너지 값을 획득한다.
단계 2043에서, 후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시, 후보 빔 데이터를 목표 빔 데이터로 선택한다.
예시적으로, 후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족하는 것은, 빔 데이터의 에너지 값이 미리 설정된 에너지 역치보다 크거나 같을 시 후보 빔 데이터를 목표 빔 데이터로 선택하고, 여기서 미리 설정된 에너지 역치는 노이즈에 대한 샘플링을 통해 획득한 노이즈 에너지 역치일 수 있는 것으로 이해할 수 있다.
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하고, 후보 빔 데이터의 에너지 값을 획득하고, 후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시 후보 빔 데이터를 목표 빔 데이터로 선택하는 것을 통해, 노이즈가 멀티 빔 선택에 대해 조성한 간섭을 모면할 수 있다.
한 실시예에서, 도 2d에 도시한 바와 같이, 단계 204에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 것은, 단계 2044 내지 단계 2047를 통해 구현할 수 있는 바,
단계 2044에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택한다.
단계 2045에서, 후보 빔 수집 방향을 결정한다.
여기서, 후보 빔 수집 방향은 후보 빔 데이터를 수집하는 소리 수집 모듈이 향하는 방향이다.
단계 2046에서, 복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정한다.
여기서, 소리 소스 방향은 소리 수집 모듈에서 소리 소스를 지향하는 방향이다.
예시적으로, 복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정하는 것은, 적어도 두 그룹의 빔 데이터 사이의 소리 소스 전파 시간 지연을 획득하고 전파 시간 지연에 따라 소리 소스 방향을 결정하는 것으로 이해할 수 있다.
단계 2047에서, 후보 빔 수집 방향과 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 후보 빔 데이터를 목표 빔 데이터로 선택한다.
예시적으로, 후보 빔 수집 방향은 당해 후보 빔이 지향하는 방향으로 이해할 수 있다. 후보 빔 수집 방향과 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 소리 소스가 당해 후보 빔이 지향하는 방향에 위치한다고 이해할 수 있다.
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하고 후보 빔 수집 방향을 결정하고 복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정하고 후보 빔 수집 방향과 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시 후보 빔 데이터를 목표 빔 데이터로 선택하는 것을 통해, 소리 소스가 목표 빔이 지향하는 방향에 위치하는 것을 확보할 수 있고, 웨이크업 워드 검출 진행 시의 성공률을 상승시킨다.
아래 실시예를 통해 구현 과정을 상세히 소개하도록 한다.
도 3은 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 방법의 개략적인 흐름도에 대해 진행한 설명이다. 도 3에 도시한 바와 같이, 이는 이하 단계를 포함하는 바,
단계301에서, 복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링한다.
단계302에서, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 각각의 빔 주파수 상관 계수를 정규화 처리한다.
단계303에서, 정규화 처리된 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득한다.
단계304에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택한다.
단계305에서, 후보 빔 데이터의 에너지 값을 획득한다.
단계306에서, 후보 빔 수집 방향을 결정한다.
여기서, 후보 빔 수집 방향은 수집 후보 빔 데이터의 소리 수집 모듈이 향하는 방향이다.
단계307에서, 복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정한다 - 소리 소스 방향은 소리 수집 모듈에서 소리 소스를 지향하는 방향임 -.
단계308에서, 후보 빔 수집 방향과 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 또한 후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시, 후보 빔 데이터를 목표 빔 데이터로 선택한다.
본 개시의 실시예에 의해 제공되는 기술안에서는, 복수의 빔 데이터를 획득하고 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하고, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하고, 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하므로, 상술한 기술안에서는, 소리 소스가 발생하는 소리에 웨이크업 워드가 포함될 시 복수의 빔 데이터 중의 목표 빔 데이터 중에서 성공적으로 웨이크업 워드를 검출하는 확률이 보다 높기 때문에 복수의 빔 데이터를 획득할 시, 전체 빔 데이터에 대해 웨이크업 워드 검출을 진행할 필요 없이 목표 빔 데이터에 대해서만 웨이크업 워드 검출을 진행하면 되므로, 웨이크업 워드 검출 속도에 영향 주지 않는 전제하에 웨이크업 워드 검출하는데 필요한 처리 자원을 감소하고 웨이크업 워드 검출하는 컴퓨팅 기기의 컴퓨팅 능력에 대한 요구를 낮춤으로써 당해 컴퓨팅 기기의 제조 비용을 낮추고 사용자 체험을 개선한다.
후술되는 것은 본 개시의 장치의 실시예로서, 본 개시의 방법의 실시예를 실행하는데 사용될 수 있다.
도 4a는 하나의 예시적인 실시예에 따라 도시한 멀티 빔 선택 장치(40)의 개략적인 구조도이고, 멀티 빔 선택 장치(40)는 전자 기기일 수 있고 전자 기기의 일부분일 수도 있는 바, 멀티 빔 선택 장치(40)는 소프트웨어, 하드웨어 또는 양자의 결합을 통해 구현되어 전자 기기의 일부 또는 전부로 될 수 있다. 도 4a에 도시한 바와 같이, 당해 멀티 빔 선택 장치(40)는,
복수의 빔 데이터를 획득하고 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하기 위한 빔 데이터 획득 모듈(401),
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하기 위한 빔 주파수 상관 계수 획득 모듈(402) - 빔 주파수 상관 계수는 복수의 빔 데이터 중 하나의 빔 데이터와 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것임 - ,
복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하기 위한 빔 주파수 상관 계수 합 획득 모듈(403), 및
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하기 위한 목표 빔 데이터 선택 모듈(404)을 포함한다.
한 실시예에서, 도 4b에 도시한 바와 같이, 빔 주파수 상관 계수 획득 모듈(402)은,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 각각의 빔 주파수 상관 계수를 정규화 처리하기 위한 정규화 처리 서브 모듈(4021)을 포함한다.
빔 주파수 상관 계수 합 획득 모듈(403)은,
정규화 처리된 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하기 위한 빔 주파수 상관 계수 합 획득 서브 모듈(4031)을 포함한다.
한 실시예에서, 도 4c에 도시한 바와 같이, 목표 빔 데이터 선택 모듈(404)은,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터, 또는 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최소인 빔 데이터를, 목표 빔 데이터로 선택하기 위한 제1 목표 빔 데이터 선택 서브 모듈(4041)을 포함한다.
한 실시예에서, 도 4d에 도시한 바와 같이, 목표 빔 데이터 선택 모듈(404)은,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하기 위한 제1 후보 빔 데이터 선택 서브 모듈(4042),
후보 빔 데이터의 에너지 값을 획득하기 위한 에너지 값 획득 서브 모듈(4043), 및
후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시, 후보 빔 데이터를 목표 빔 데이터로 선택하기 위한 제2 목표 빔 데이터 선택 서브 모듈(4044)을 포함한다.
한 실시예에서, 도 4e에 도시한 바와 같이, 목표 빔 데이터 선택 모듈(404)은,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하기 위한 제1 후보 빔 데이터 선택 서브 모듈(4045),
후보 빔 수집 방향을 결정하기 위한 후보 빔 수집 방향 결정 서브 모듈(4046) - 후보 빔 수집 방향은 후보 빔 데이터를 수집하는 소리 수집 모듈이 향하는 방향임 -,
복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정하기 위한 소리 소스 방향 결정 서브 모듈(4047) - 소리 소스 방향은 소리 수집 모듈에서 소리 소스를 지향하는 방향임 -, 및
후보 빔 수집 방향과 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 후보 빔 데이터를 목표 빔 데이터로 선택하기 위한 제3 목표 빔 데이터 선택 서브 모듈(4048)을 포함한다.
본 개시의 실시예는 멀티 빔 선택 장치를 제공하는바, 당해 멀티 빔 선택 장치는 복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하고, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하고, 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를 목표 빔 데이터로 선택하므로, 상술한 기술안에서는, 소리 소스가 발생하는 소리에 웨이크업 워드가 포함될 시 복수의 빔 데이터 중의 목표 빔 데이터 중에서 성공적으로 웨이크업 워드를 검출하는 확률이 보다 높기 때문에, 복수의 빔 데이터를 획득할 시 전체 빔 데이터에 대해 웨이크업 워드 검출을 진행할 필요 없이 목표 빔 데이터에 대해서만 웨이크업 워드 검출을 진행하면 되므로, 웨이크업 워드 검출 속도에 영향 주지 않는 전제하에 웨이크업 워드 검출하는데 필요한 처리 자원을 감소하고 웨이크업 워드 검출하는 컴퓨팅 기기의 컴퓨팅 능력에 대한 요구를 낮춤으로써 당해 컴퓨팅 기기의 제조 비용을 낮추고 사용자 체험을 개선한다.
도 5는 한 예시적인 실시예에 따라 도시한 멀티 빔 선택 장치(50)의 블록도이고, 당해 멀티 빔 선택 장치(50)는 전자 기기일 수 있고 전자 기기의 일부분일 수도 있는 바, 멀티 빔 선택 장치(50)는,
프로세서(501), 및
프로세서(501) 실행 가능 명령을 저장하기 위한 메모리(502)를 포함하고,
프로세서(501)는,
복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하고,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고 - 빔 주파수 상관 계수는 복수의 빔 데이터 중 하나의 빔 데이터와 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것임 -,
복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하고, 및
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하도록 구성된다.
한 실시예에서, 상술한 프로세서(501)는 또한,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하는것은,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고 각각의 빔 주파수 상관 계수를 정규화 처리하는 것을 포함하고,
복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 것은,
정규화 처리된 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 것을 포함하도록 구성될 수 있다.
한 실시예에서, 상술한 프로세서(501)는 또한,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 것은,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터, 또는 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최소인 빔 데이터를, 목표 빔 데이터로 선택하는 것을 포함하도록 구성될 수 있다.
한 실시예에서, 상술한 프로세서(501)는 또한,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 것은,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하는 것,
후보 빔 데이터의 에너지 값을 획득하는 것, 및
후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시, 후보 빔 데이터를 목표 빔 데이터로 선택하는 것을 포함하도록 구성될 수 있다.
한 실시예에서, 상술한 프로세서(501)는 또한,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 것은,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하는 것,
후보 빔 수집 방향을 결정하는 것 - 후보 빔 수집 방향은 후보 빔 데이터를 수집하는 소리 수집 모듈이 향하는 방향임 -,
복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정하는 것 - 소리 소스 방향은 소리 수집 모듈에서 소리 소스를 지향하는 방향임 -, 및
후보 빔 수집 방향과 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 후보 빔 데이터를 목표 빔 데이터로 선택하는 것을 포함하도록 구성될 수 있다.
본 개시의 실시예는 멀티 빔 선택 장치를 제공하는바, 당해 멀티 빔 선택 장치는, 복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하고, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하고, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하므로, 상술한 기술안에서는, 소리 소스가 발생하는 소리에 웨이크업 워드가 포함될 시 복수의 빔 데이터 중의 목표 빔 데이터 중에서 성공적으로 웨이크업 워드를 검출하는 확률이 보다 높기 때문에, 복수의 빔 데이터를 획득할 시 전체 빔 데이터에 대해 웨이크업 워드 검출을 진행할 필요 없이 목표 빔 데이터에 대해서만 웨이크업 워드 검출을 진행하면 되므로, 웨이크업 워드 검출 속도에 영향 주지 않는 전제하에 웨이크업 워드 검출하는데 필요한 처리 자원을 감소하고 웨이크업 워드 검출하는 컴퓨팅 기기의 컴퓨팅 능력에 대한 요구를 낮춤으로써 당해 컴퓨팅 기기의 제조 비용을 낮추고 사용자 체험을 개선할 수 있다.
도 6은 한 예시적인 실시예에 따라 도시한 멀티 빔을 선택하는 장치(600)의 블록도이다. 당해 장치(600)는 전자 기기에 적용된다. 예하면, 장치(600)는 스마트 스피커, 모바일 폰, 컴퓨터, 디지털 방송 단말기, 메시지 발신/수신 기기, 게임 제어 플랫폼, 태블릿 기기, 의료 기기, 헬스 기기, 개인용 디지털 도우미 등일 수 있다.
장치(600)는 프로세싱 어셈블리(602), 메모리(604), 전원 어셈블리(606), 멀티미디어 어셈블리(608), 오디오 어셈블리(610), 입력/출력(I/O)의 인터페이스(612), 센서 어셈블리(614) 및 통신 어셈블리(616) 중의 하나 또는 복수의 어셈블리를 포함할 수 있다.
프로세싱 어셈블리(602)는 통상적으로, 장치(600)의 전반 동작을 제어하는바, 예하면, 디스플레이, 전화 호출, 데이터 통신, 카메라 동작 및 기록 동작과 관련되는 동작이다. 프로세싱 어셈블리(602)는 하나 또는 복수의 프로세서(620)를 포함하여 명령을 실행함으로써 상술한 방법의 전부 또는 일부 단계를 완수할 수 있다. 이 외에도, 프로세싱 어셈블리(602)는 모듈을 하나 또는 복수의 포함하여 프로세싱 어셈블리(602)와 기타 어셈블리 사이의 인터랙션을 편리하게 할 수 있다. 예하면, 프로세싱 어셈블리(602)는 멀티미디어 모듈을 포함하여 멀티미디어 어셈블리(608)와 프로세싱 어셈블리(602) 사이의 인터랙션을 편리하게 할 수 있다.
메모리(604)는 각 유형의 데이터를 저장하여 장치(600)에서의 동작을 지원하도록 구성된다. 이러한 데이터의 예시는 장치(600)에서 동작하기 위한 임의 응용 프로그램 또는 방법의 명령, 연락처 데이터, 전화번호부 데이터, 메세지, 포토, 영상 등을 포함한다. 메모리(604)는 정적 랜덤 액세스 메모리(SRAM), 전기적 삭제 및 프로그래밍 가능 읽기 전용 메모리(EEPROM), 삭제 및 프로그래밍 가능 읽기 전용 메모리(EPROM), 프로그래밍 가능 읽기 전용 메모리(PROM), 읽기 전용 메모리(ROM), 자기 메모리, 플래시 메모리, 자기 디스크 또는 광 디스크와 같은 임의 유형의 휘발성 또는 비휘발성 저장 기기 또는 이들의 조합으로 구현될 수 있다.
전원 어셈블리(606)는 장치(600)의 각 어셈블리에 전력을 제공한다. 전원 어셈블리(606)는 전원 관리 시스템, 하나 또는 복수의 전원, 또한 장치(600)에 대한 전력 생성, 관리 및 배분과 관련되는 기타의 어셈블리를 포함할 수 있다.
멀티미디어 어셈블리(608)는 장치(600)와 사용자 사이에서 하나의 출력 인터페이스를 제공하기 위한 스크린을 포함한다. 일부 실시예에서, 스크린은 액정 디스플레이(LCD) 및 터치 패널(TP)을 포함할 수 있다. 만약 스크린이 터치 패널을 포함한다면, 스크린은 터치 스크린으로 구현되어 사용자한테서 온 입력 신호를 수신할 수 있다. 터치 패널은 하나 또는 복수의 터치 센서를 포함하여 터치, 스와이프 및 터치 패널에서의 제스처를 감지한다. 상기 터치 센서는 터치 또는 스와이프 동작의 경계를 감지할 수 있을 뿐만 아니라, 또한, 상기 터치 또는 스와이프 동작과 관련되는 지속 시간 및 압력을 검출할 수 있다. 일부 실시예에서, 멀티미디어 어셈블리(608)는 하나의 전방 카메라 및/또는 후방 카메라를 포함한다. 장치(600)가 동작 모드에 처할 시, 예하면 촬영 모드 또는 영상 모드일 시, 전방 카메라 및/또는 후방 카메라는 외부의 멀티미디어 데이터를 수신할 수 있다. 매개 전방 카메라 및 후방 카메라는 하나의 고정된 광학 렌즈 시스템이거나 또는 초점 거리 및 광학 줌 능력을 구비할 수 있다.
오디오 어셈블리(610)는 오디오 신호를 출력 및/또는 입력하도록 구성된다. 예하면, 오디오 어셈블리(610)는 하나의 마이크로폰(MIC)을 포함하고, 장치(600)가 동작 모드, 예하면 호출 모드, 기록 모드 및 음성 인식 모드일 시, 마이크로폰은 외부 오디오 신호를 수신하도록 구성된다. 수신한 오디오 신호는 나아가 메모리(604)에 저장되거나 또는 통신 어셈블리(616)를 경유하여 송신될 수 있다. 일부 실시예에서, 오디오 어셈블리(610)는 또한 하나의 스피커를 포함하는바, 이는 오디오 신호를 출력하기 위한 것이다.
I/O 인터페이스(612)는 프로세싱 어셈블리(602)와 주변 인터페이스 모듈 사이에 인터페이스를 제공하는바, 상술한 주변 인터페이스 모듈은 키보드, 클릭 휠, 버튼 등일 수 있다. 이러한 버튼은 홈 버튼, 볼륨 버튼, 스타트 버튼 및 잠금 버튼을 포함할 수 있으나 이에 한정되지 않는다.
센서 어셈블리(614)는 하나 또는 복수의 센서를 포함하는바, 장치(600)한테 각각의 측면의 상태 평가를 제공하기 위한 것이다. 예하면, 센서 어셈블리(614)는 장치(600)의 턴온/턴오프 상태 및 어셈블리의 상대 포지셔닝을 검출할 수 있는 바, 예하면 상기 어셈블리는 장치(600)의 디스플레이 및 키패드이고, 센서 어셈블리(614)는 또한 장치(600) 또는 장치(600) 어셈블리 하나의 위치 변화, 사용자와 장치(600)와의 접촉이 존재하는지 또는 존재하지 않는지, 장치(600)의 방위 또는 가속/감속 및 장치(600)의 온도 변화를 검출할 수 있다. 센서 어셈블리(614)는 근접 센서를 포함할 수 있고, 이는 아무런 물리 접촉도 없을 시에 인근 물체의 존재를 검출하기 위하여 구성된 것이다. 센서 어셈블리(614)는 또한 광 센서, 예하면 CMOS 또는 CCD이미지 센서를 포함할 수 있고, 이는 이미징 애플리케이션에 사용하기 위한 것이다. 일부 실시예에서, 당해 센서 어셈블리(614)는 또한 가속도 센서, 자이로 센서, 자기 센서, 압력 센서 또는 온도 센서를 포함할 수 있다.
통신 어셈블리(616)는 장치(600)와 기타 기기 사이의 유선 또는 무선 방식의 통신이 편리하기 위해 구성되는 것이다. 장치(600)는 무전기 전용 네트워크, WiFi, 2G, 3G, 4G 또는 5G, 또는 이들의 조합과 같이 통신 표준에 기반하는 무선 네트워크에 접속할 수 있다. 하나의 예시적인 실시예에서, 통신 어셈블리(616)는 방송 채널을 경유하여 외부 방송 관리 시스템에서 온 방송 신호 또는 방송 관련 정보를 수신한다. 하나의 예시적인 실시예에서, 상기 통신 어셈블리(616)는 또한 근거리장 통신(NFC) 모듈을 포함하는바, 단거리 통신을 촉진한다. 예하면, NFC 모듈에 있어서, 무선 주파수 인식(RFID) 기술, 적외선 데이터 협회 (IrDA) 기술, 초광대역(UWB) 기술, 블루투스(BT) 기술 및 기타 기술을 기반으로 구현될 수 있다.
예시적인 실시예에서, 장치(600)는 하나 또는 복수의 응용프로그램 전용 집적 회로(ASIC), 디지털 신호 프로세서(DSP), 디지털 신호 프로세싱 기기(DSPD), 프로그램 가능 논리 소자(PLD), 프로그램 가능 게이트 어레이(FPGA), 제어기, 마이크로 제어기, 마이크로 프로세서 또는 기타 전자 소자에 의해 구현될 수 있는 바, 상술한 방법을 실행하기 위한 것이다.
예시적인 실시예에서, 또한 명령을 포함하는 비임시성 컴퓨터 판독 가능 저장 매체를 제공하는바, 예하면 명령을 포함하는 메모리(604)이다. 상술한 명령은 장치(600)의 프로세서(620)에 의해 실행되어 상술한 방법을 완수할 수 있다. 예하면, 상기 비임시성 컴퓨터 판독 가능 저장 매체는 ROM, 랜덤 액세스 메모리(RAM), CD-ROM, 자기 테이프, 플로피 디스크 및 광 데이터 저장 기기 등일 수 있다.
비임시성 컴퓨터 판독 가능 저장 매체에 있어서, 상기 저장 매체 중의 명령이 장치(600)의 프로세서에 의해 실행될 시, 장치(600)는 상술한 멀티 빔 선택 방법을 실행할 수 있게 되는바, 상기 방법은,
복수의 빔 데이터를 획득하고, 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하는 단계,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하는 단계 - 빔 주파수 상관 계수는 복수의 빔 데이터 중 하나의 빔 데이터와 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것임 -,
복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계, 및
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계를 포함한다.
한 실시예에서, 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하는 단계는,
복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고 각각의 빔 주파수 상관 계수를 정규화 처리하는 단계를 포함하고,
복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계는,
정규화 처리된 복수의 빔 주파수 상관 계수에 따라 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계를 포함한다.
한 실시예에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계는,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터, 또는 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터 및 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최소인 빔 데이터를, 목표 빔 데이터로 선택하는 단계를 포함한다.
한 실시예에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계는,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하는 단계,
후보 빔 데이터의 에너지 값을 획득하는 단계, 및
후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시, 후보 빔 데이터를 목표 빔 데이터로 선택하는 단계를 포함한다.
한 실시예에서, 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계는,
복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하는 단계,
후보 빔 수집 방향을 결정하는 단계 - 후보 빔 수집 방향은 후보 빔 데이터를 수집하는 소리 수집 모듈이 향하는 방향임 -,
복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정하는 단계 - 소리 소스 방향은 소리 수집 모듈에서 소리 소스를 지향하는 방향임 -, 및
후보 빔 수집 방향과 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 후보 빔 데이터를 목표 빔 데이터로 선택하는 단계를 포함한다.
본 기술 분야의 당업자라면 명세서를 고려해보고 또한 여기 개시된 발명을 실천해보고 나면 쉽게 본 발명의 기타 실시 기술안을 생각해낼 수 있을 것이다. 본 출원은 본 발명의 임의 변형, 용도 또는 적응적 변화를 포함하고자 하는바, 이러한 변형, 용도 또는 적응적 변화는 본 발명의 일반적 원리를 준수하고, 본 개시에서 공개되지 않은 본 기술 분야의 공지 상식 또는 통상적 기술 수단도 이에 포함된다. 명세서 및 실시예는 예시적인 것으로만 간주되어야 할 것이며 본 발명의 진정한 범위와 요지는 특허청구범위에 의해 지시된다.
본 발명은 이상에서 이미 설명되고 첨부 도면에서 도시한 정확한 구조에 하정되지 않는바, 그 범위를 벗어나지 않으면서 다양한 수정과 변경이 가능하며 본 발명의 범위는 오직 첨부된 특허청구범위에 의해 한정됨을 이해하여야 한다.

Claims (12)

  1. 멀티 빔 선택 방법에 있어서,
    복수의 빔 데이터를 획득하고, 상기 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하는 단계,
    상기 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하는 단계 - 상기 빔 주파수 상관 계수는 상기 복수의 빔 데이터 중 하나의 빔 데이터와 상기 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것임 -,
    상기 복수의 빔 주파수 상관 계수에 따라 상기 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계, 및
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계,를 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 방법.
  2. 제1항에 있어서,
    상기 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하는 단계는,
    상기 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 각각의 상기 빔 주파수 상관 계수를 정규화 처리하는 단계를 포함하고,
    상기 복수의 빔 주파수 상관 계수에 따라 상기 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계는,
    정규화 처리된 복수의 빔 주파수 상관 계수에 따라 상기 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하는 단계를 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 방법.
  3. 제1항에 있어서,
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계는,
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터, 또는 상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터 및 상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최소인 빔 데이터를, 상기 목표 빔 데이터로 선택하는 단계를 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 방법.
  4. 제1항에 있어서,
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계는,
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 상기 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하는 단계,
    상기 후보 빔 데이터의 에너지 값을 획득하는 단계, 및
    상기 후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시, 상기 후보 빔 데이터를 상기 목표 빔 데이터로 선택하는 단계, 를 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 방법.
  5. 제1항에 있어서,
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하는 단계는,
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 상기 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하는 단계,
    후보 빔 수집 방향을 결정하는 단계 - 상기 후보 빔 수집 방향은 상기 후보 빔 데이터를 수집하는 소리 수집 모듈이 향하는 방향임 -,
    상기 복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정하는 단계 - 상기 소리 소스 방향은 상기 소리 수집 모듈에서 소리 소스를 지향하는 방향임 -, 및
    상기 후보 빔 수집 방향과 상기 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 상기 후보 빔 데이터를 상기 목표 빔 데이터로 선택하는 단계, 를 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 방법.
  6. 멀티 빔 선택 장치로서,
    복수의 빔 데이터를 획득하고, 상기 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하기 위한 빔 데이터 획득 모듈,
    상기 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하기 위한 빔 주파수 상관 계수 획득 모듈 - 상기 빔 주파수 상관 계수는 상기 복수의 빔 데이터 중 하나의 빔 데이터와 상기 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것임 -,
    상기 복수의 빔 주파수 상관 계수에 따라 상기 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하기 위한 빔 주파수 상관 계수 합 획득 모듈, 및
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하기 위한 목표 빔 데이터 선택 모듈, 을 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 장치.
  7. 제1항에 있어서,
    상기 빔 주파수 상관 계수 획득 모듈은,
    상기 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 각각의 상기 빔 주파수 상관 계수를 정규화 처리하기 위한 정규화 처리 서브 모듈을 포함하고,
    상기 빔 주파수 상관 계수 합 획득 모듈은,
    정규화 처리된 복수의 빔 주파수 상관 계수에 따라 상기 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하기 위한 빔 주파수 상관 계수 합 획득 서브 모듈을 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 장치.
  8. 제1항에 있어서,
    상기 목표 빔 데이터 선택 모듈은,
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터, 또는 상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최대인 빔 데이터 및 상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 최소인 빔 데이터를, 상기 목표 빔 데이터로 선택하기 위한 제1 목표 빔 데이터 선택 서브 모듈을 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 장치.
  9. 제1항에 있어서,
    상기 목표 빔 데이터 선택 모듈은,
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 상기 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하기 위한 제1 후보 빔 데이터 선택 서브 모듈,
    상기 후보 빔 데이터의 에너지 값을 획득하기 위한 에너지 값 획득 서브 모듈, 및
    상기 후보 빔 데이터의 에너지 값이 미리 설정된 에너지 값 요구를 만족할 시, 상기 후보 빔 데이터를 상기 목표 빔 데이터로 선택하기 위한 제2 목표 빔 데이터 선택 서브 모듈, 을 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 장치.
  10. 제1항에 있어서,
    상기 목표 빔 데이터 선택 모듈은,
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 상기 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 후보 빔 데이터로 선택하기 위한 제1 후보 빔 데이터 선택 서브 모듈,
    후보 빔 수집 방향을 결정하기 위한 후보 빔 수집 방향 결정 서브 모듈 - 상기 후보 빔 수집 방향은 상기 후보 빔 데이터를 수집하는 소리 수집 모듈이 향하는 방향임 -,
    상기 복수의 빔 데이터 중 적어도 두 그룹의 빔 데이터에 따라 소리 소스 방향을 결정하기 위한 소리 소스 방향 결정 서브 모듈 - 상기 소리 소스 방향은 상기 소리 수집 모듈에서 소리 소스를 지향하는 방향임 -, 및
    상기 후보 빔 수집 방향과 상기 소리 소스 방향 사이의 각도 차가 미리 설정된 각도 차보다 작거나 같을 시, 상기 후보 빔 데이터를 상기 목표 빔 데이터로 선택하기 위한 제3 목표 빔 데이터 선택 서브 모듈, 을 포함하는 것,
    을 특징으로 하는 멀티 빔 선택 장치.
  11. 멀티 빔 선택 장치로서,
    프로세서, 및
    프로세서에 의해 실행 가능한 명령을 저장하기 위한 메모리, 를 포함하는 바,
    상기 프로세서는,
    복수의 빔 데이터를 획득하고, 상기 복수의 빔 데이터 중의 각각의 빔 데이터에 대해 주파수 샘플링하고,
    상기 복수의 빔 데이터 중의 각각의 빔 데이터의 주파수 샘플링 데이터에 따라 복수의 빔 주파수 상관 계수를 획득하고, 상기 빔 주파수 상관 계수는 상기 복수의 빔 데이터 중 하나의 빔 데이터와 상기 복수의 빔 데이터 중 다른 하나의 빔 데이터 사이의 유사도를 나타내기 위한 것이며,
    상기 복수의 빔 주파수 상관 계수에 따라 상기 복수의 빔 데이터 중 각각의 빔 데이터에 대응되는 빔 주파수 상관 계수 합을 획득하고
    상기 복수의 빔 데이터 중 대응되는 빔 주파수 상관 계수 합이 미리 설정된 상관 계수 요구를 만족하는 빔 데이터를, 목표 빔 데이터로 선택하도록 구성되는 것,
    을 특징으로 하는 멀티 빔 선택 장치.
  12. 컴퓨터 명령이 저장되어 있는 컴퓨터 판독 가능 저장 매체로서,
    당해 명령이 프로세서에 의해 실행될 시 제1항 내지 제5항 중 어느 한 항의 방법의 단계를 구현하는 것,
    을 특징으로 하는 컴퓨터 판독 가능 저장 매체.
KR1020197017626A 2018-11-20 2019-03-05 멀티 빔 선택 방법 및 장치 KR102240490B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201811385651.1 2018-11-20
CN201811385651.1A CN109599104B (zh) 2018-11-20 2018-11-20 多波束选取方法及装置
PCT/CN2019/077022 WO2020103353A1 (zh) 2018-11-20 2019-03-05 多波束选取方法及装置

Publications (2)

Publication Number Publication Date
KR20200063095A true KR20200063095A (ko) 2020-06-04
KR102240490B1 KR102240490B1 (ko) 2021-04-15

Family

ID=65958757

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197017626A KR102240490B1 (ko) 2018-11-20 2019-03-05 멀티 빔 선택 방법 및 장치

Country Status (7)

Country Link
US (1) US11337173B2 (ko)
EP (1) EP3657497B1 (ko)
JP (1) JP6964666B2 (ko)
KR (1) KR102240490B1 (ko)
CN (1) CN109599104B (ko)
RU (1) RU2717912C1 (ko)
WO (1) WO2020103353A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109599104B (zh) * 2018-11-20 2022-04-01 北京小米智能科技有限公司 多波束选取方法及装置
CN111833901B (zh) * 2019-04-23 2024-04-05 北京京东尚科信息技术有限公司 音频处理方法、音频处理装置、系统及介质
CN110364161A (zh) 2019-08-22 2019-10-22 北京小米智能科技有限公司 响应语音信号的方法、电子设备、介质及系统
US11990973B2 (en) * 2020-04-20 2024-05-21 Telefonaktiebolaget Lm Ericsson (Publ) Beam management for a radio transceiver device
CN112492452B (zh) * 2020-11-26 2022-08-26 北京字节跳动网络技术有限公司 波束系数存储方法、装置、设备和存储介质
JP2023554206A (ja) * 2021-11-19 2023-12-27 シェンツェン・ショックス・カンパニー・リミテッド オープン型音響装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060043338A (ko) * 2004-03-02 2006-05-15 마이크로소프트 코포레이션 마이크로폰 어레이를 사용하는 빔성형 시스템 및 방법
KR20140108788A (ko) * 2013-02-28 2014-09-15 경북대학교 산학협력단 단일 마이크로폰을 이용한 접촉식 인터페이스 장치
CN108122563A (zh) * 2017-12-19 2018-06-05 北京声智科技有限公司 提高语音唤醒率及修正doa的方法
KR20180077242A (ko) * 2016-02-22 2018-07-06 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 에코 제거 방법, 디바이스, 및 컴퓨터 저장 매체
KR20180103634A (ko) * 2017-03-10 2018-09-19 주식회사 쿨잼컴퍼니 통계적 방법에 의한 음향 분석 및 비교
KR20180103639A (ko) * 2017-03-11 2018-09-19 주식회사 쿨잼컴퍼니 상대적 유사도에 기초한 음악 시퀀스들의 유사도 분석
CN109599104A (zh) * 2018-11-20 2019-04-09 北京小米智能科技有限公司 多波束选取方法及装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2861011B2 (ja) * 1989-01-11 1999-02-24 アイシン精機株式会社 音声入力方法及び装置
US7426464B2 (en) * 2004-07-15 2008-09-16 Bitwave Pte Ltd. Signal processing apparatus and method for reducing noise and interference in speech communication and speech recognition
EP2104096B1 (en) * 2008-03-20 2020-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
JP2011257627A (ja) * 2010-06-10 2011-12-22 Murata Mach Ltd 音声認識装置と認識方法
GB2495129B (en) * 2011-09-30 2017-07-19 Skype Processing signals
US20130329908A1 (en) * 2012-06-08 2013-12-12 Apple Inc. Adjusting audio beamforming settings based on system state
US9489965B2 (en) * 2013-03-15 2016-11-08 Sri International Method and apparatus for acoustic signal characterization
WO2014175591A1 (ko) * 2013-04-27 2014-10-30 인텔렉추얼디스커버리 주식회사 오디오 신호처리 방법
KR101491354B1 (ko) * 2013-11-25 2015-02-06 현대자동차주식회사 음성인식 장치 및 방법
KR102146462B1 (ko) * 2014-03-31 2020-08-20 삼성전자주식회사 음성 인식 시스템 및 방법
CN105590631B (zh) * 2014-11-14 2020-04-07 中兴通讯股份有限公司 信号处理的方法及装置
KR102346302B1 (ko) * 2015-02-16 2022-01-03 삼성전자 주식회사 전자 장치 및 음성 인식 기능 운용 방법
CN104810021B (zh) * 2015-05-11 2017-08-18 百度在线网络技术(北京)有限公司 应用于远场识别的前处理方法和装置
US9820036B1 (en) * 2015-12-30 2017-11-14 Amazon Technologies, Inc. Speech processing of reflected sound
US9653060B1 (en) * 2016-02-09 2017-05-16 Amazon Technologies, Inc. Hybrid reference signal for acoustic echo cancellation
CN106023996B (zh) * 2016-06-12 2019-08-27 杭州电子科技大学 基于十字形声阵列宽带波束形成的声识别方法
US9972337B2 (en) * 2016-06-22 2018-05-15 Cisco Technology, Inc. Acoustic echo cancellation with delay uncertainty and delay change
JP6387151B2 (ja) * 2016-09-30 2018-09-05 パナソニック株式会社 雑音抑圧装置、及び、雑音抑圧方法
CN106952653B (zh) * 2017-03-15 2021-05-04 科大讯飞股份有限公司 噪声去除方法、装置和终端设备
CN107274911A (zh) * 2017-05-03 2017-10-20 昆明理工大学 一种基于声音特征的相似度分析方法
CN107221320A (zh) * 2017-05-19 2017-09-29 百度在线网络技术(北京)有限公司 训练声学特征提取模型的方法、装置、设备和计算机存储介质
US10051366B1 (en) * 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
CN108181612B (zh) * 2017-12-22 2019-05-21 达闼科技(北京)有限公司 确定麦克风波束成型角度的方法及相关装置
CN108717495A (zh) * 2018-05-22 2018-10-30 出门问问信息科技有限公司 多波束波束成形的方法、装置及电子设备
US10622004B1 (en) * 2018-08-20 2020-04-14 Amazon Technologies, Inc. Acoustic echo cancellation using loudspeaker position

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060043338A (ko) * 2004-03-02 2006-05-15 마이크로소프트 코포레이션 마이크로폰 어레이를 사용하는 빔성형 시스템 및 방법
KR20140108788A (ko) * 2013-02-28 2014-09-15 경북대학교 산학협력단 단일 마이크로폰을 이용한 접촉식 인터페이스 장치
KR20180077242A (ko) * 2016-02-22 2018-07-06 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 에코 제거 방법, 디바이스, 및 컴퓨터 저장 매체
KR20180103634A (ko) * 2017-03-10 2018-09-19 주식회사 쿨잼컴퍼니 통계적 방법에 의한 음향 분석 및 비교
KR20180103639A (ko) * 2017-03-11 2018-09-19 주식회사 쿨잼컴퍼니 상대적 유사도에 기초한 음악 시퀀스들의 유사도 분석
CN108122563A (zh) * 2017-12-19 2018-06-05 北京声智科技有限公司 提高语音唤醒率及修正doa的方法
CN109599104A (zh) * 2018-11-20 2019-04-09 北京小米智能科技有限公司 多波束选取方法及装置

Also Published As

Publication number Publication date
EP3657497A1 (en) 2020-05-27
JP6964666B2 (ja) 2021-11-10
CN109599104A (zh) 2019-04-09
JP2021509963A (ja) 2021-04-08
US11337173B2 (en) 2022-05-17
RU2717912C1 (ru) 2020-03-26
WO2020103353A1 (zh) 2020-05-28
EP3657497B1 (en) 2024-01-10
US20200163038A1 (en) 2020-05-21
KR102240490B1 (ko) 2021-04-15
CN109599104B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
KR102240490B1 (ko) 멀티 빔 선택 방법 및 장치
RU2716741C1 (ru) Способ и устройство для передачи системной информации
CN107492115B (zh) 目标对象的检测方法及装置
RU2628473C2 (ru) Способ и устройство для оптимизации звукового сигнала
EP3073792A1 (en) Method and device for awaking element
JP6355735B2 (ja) 省エネルギーモードを開始するための方法及び装置
US11514711B2 (en) Fingerprint identification method and apparatus
EP2922212B1 (en) Method, apparatus and system for controlling emission
US11727928B2 (en) Responding method and device, electronic device and storage medium
CN110262692B (zh) 一种触摸屏扫描方法、装置及介质
US11222223B2 (en) Collecting fingerprints
US11832180B2 (en) Information transmission method and electronic device
US10885298B2 (en) Method and device for optical fingerprint recognition, and computer-readable storage medium
CN111580773A (zh) 信息处理方法、装置及存储介质
CN105930034B (zh) 显示对话框的方法和装置
US11966451B2 (en) Method for optimizing deep learning operator, device and storage medium
US10671827B2 (en) Method and device for fingerprint verification
US10531401B2 (en) Method, terminal device and system for controlling transmission
CN111259675B (zh) 基于神经网络计算的方法和装置
CN113204443A (zh) 基于联邦学习框架的数据处理方法、设备、介质及产品
CN111857396A (zh) 信号扫描方法、装置、终端和存储介质
CN116051760A (zh) 三维模型创建方法、装置及存储介质
CN117636893A (zh) 风噪检测方法、装置、可穿戴设备及可读储存介质
CN116030804A (zh) 一种语音唤醒方法、语音唤醒装置及存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant