JP6964666B2 - マルチビーム選定方法及び装置 - Google Patents
マルチビーム選定方法及び装置 Download PDFInfo
- Publication number
- JP6964666B2 JP6964666B2 JP2019528751A JP2019528751A JP6964666B2 JP 6964666 B2 JP6964666 B2 JP 6964666B2 JP 2019528751 A JP2019528751 A JP 2019528751A JP 2019528751 A JP2019528751 A JP 2019528751A JP 6964666 B2 JP6964666 B2 JP 6964666B2
- Authority
- JP
- Japan
- Prior art keywords
- beam data
- data
- frequencies
- correlation coefficient
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010187 selection method Methods 0.000 title claims description 17
- 238000005070 sampling Methods 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 description 50
- 238000001514 detection method Methods 0.000 description 20
- 238000005516 engineering process Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W56/00—Synchronisation arrangements
- H04W56/0055—Synchronisation arrangements determining timing error of reception due to propagation delay
- H04W56/0065—Synchronisation arrangements determining timing error of reception due to propagation delay using measurement of signal travel time
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/48—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
- G01S7/491—Details of non-pulse systems
- G01S7/4911—Transmitters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/48—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
- G01S7/483—Details of pulse systems
- G01S7/484—Transmitters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/02—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
- H04B7/04—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
- H04B7/0408—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas using two or more beams, i.e. beam diversity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/02—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
- H04B7/04—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
- H04B7/06—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
- H04B7/0613—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
- H04B7/0615—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
- H04B7/0617—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal for beam forming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B7/00—Radio transmission systems, i.e. using radiation field
- H04B7/02—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
- H04B7/04—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
- H04B7/06—Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
- H04B7/0686—Hybrid systems, i.e. switching and simultaneous transmission
- H04B7/0695—Hybrid systems, i.e. switching and simultaneous transmission using beam selection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L27/00—Modulated-carrier systems
- H04L27/26—Systems using multi-frequency codes
- H04L27/2601—Multicarrier modulation systems
- H04L27/2647—Arrangements specific to the receiver only
- H04L27/2655—Synchronisation arrangements
- H04L27/2657—Carrier synchronisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L27/00—Modulated-carrier systems
- H04L27/26—Systems using multi-frequency codes
- H04L27/2601—Multicarrier modulation systems
- H04L27/2647—Arrangements specific to the receiver only
- H04L27/2655—Synchronisation arrangements
- H04L27/2666—Acquisition of further OFDM parameters, e.g. bandwidth, subcarrier spacing, or guard interval length
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
複数のビームデータを取得し、複数のビームデータ内の各ビームデータに対して、周波数サンプリングを行うステップと、
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得するステップであって、ビーム周波数の相関係数が、複数のビームデータ内の一つのビームデータと複数のビームデータ内のもう一つのビームデータとの類似度を示すためのものであるステップと、
複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するステップと、
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するステップと、を含む、
マルチビーム選定方法を提供する。
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、各ビーム周波数の相関係数を正規化処理するステップを含み、
複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するステップは、
正規化処理された複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するステップを含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ、又は、複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ及び複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も小さいビームデータを目標ビームデータとして選定するステップを含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するステップと、
候補ビームデータのエネルギー値を取得するステップと、
候補ビームデータのエネルギー値が予め設定されたエネルギー値の要求を満たす場合、候補ビームデータを目標ビームデータとして選定するステップと、を含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するステップと、
候補ビームデータを収集する音声収集モジュールが向けられる方向である候補ビーム収集方向を決定するステップと、
複数のビームデータ内の少なくとも2組のビームデータに基づいて、音声収集モジュールから音源に向けられる方向である音源方向を決定するステップと、
候補ビーム収集方向と音源方向との間の角度差が予め設定された角度差以下である場合、候補ビームデータを目標ビームデータとして選定するステップと、を含む。
複数のビームデータを取得し、複数のビームデータ内の各ビームデータに対して、周波数サンプリングを行うためのビームデータ取得モジュールと、
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得するためのビーム周波数相関係数取得モジュールであって、ビーム周波数の相関係数が、複数のビームデータ内の一つのビームデータと複数のビームデータ内のもう一つのビームデータとの類似度を示すためのものであるビーム周波数相関係数取得モジュールと、
複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するためのビーム周波数相関係数合計取得モジュールと、
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するための目標ビームデータ選定モジュールと、を含む、
マルチビーム選定装置を提供する。
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、各ビーム周波数の相関係数を正規化処理するための正規化処理サブモジュールを含み、
ビーム周波数相関係数合計取得モジュールは、
正規化処理された複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するためのビーム周波数相関係数合計取得サブモジュールを含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ、又は、複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ及び複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も小さいビームデータを目標ビームデータとして選定するための第1の目標ビームデータ選定サブモジュールを含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するための第1の候補ビームデータ選定サブモジュールと、
候補ビームデータのエネルギー値を取得するためのエネルギー値取得サブモジュールと、
候補ビームデータのエネルギー値が予め設定されたエネルギー値の要求を満たす場合、候補ビームデータを目標ビームデータとして選定するための第2の目標ビームデータ選定サブモジュールと、を含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するための第1の候補ビームデータ選定サブモジュールと、
候補ビームデータを収集する音声収集モジュールが向けられる方向である候補ビーム収集方向を決定する候補ビーム収集方向決定サブモジュールと、
複数のビームデータ内の少なくとも2組のビームデータに基づいて、音声収集モジュールから音源に向けられる方向である音源方向を決定するための音源方向決定サブモジュールと、
候補ビーム収集方向と音源方向との間の角度差が予め設定された角度差以下である場合、候補ビームデータを目標ビームデータとして選定するための第3の目標ビームデータ選定サブモジュールと、を含む。
プロセッサと、
プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、
プロセッサは、
複数のビームデータを取得し、複数のビームデータ内の各ビームデータに対して、周波数サンプリングを行い、
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、ビーム周波数の相関係数が、複数のビームデータ内の一つのビームデータと複数のビームデータ内のもう一つのビームデータとの類似度を示すためのものであり、
複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得し、
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するように構成される、
マルチビーム選定装置を提供する。
コンピュータ命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、
当該命令がプロセッサによって実行されるとき、本開示の実施例の第1の態様のいずれかの方法のステップを実現する、
コンピュータ読み取り可能な記憶媒体を提供する。
複数のビームデータを取得し、複数のビームデータ内の各ビームデータに対して、周波数サンプリングを行うためのビームデータ取得モジュール401と、
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得するためのビーム周波数相関係数取得モジュール402であって、ビーム周波数の相関係数が、複数のビームデータ内の一つのビームデータと複数のビームデータ内のもう一つのビームデータとの類似度を示すためのものであるビーム周波数相関係数取得モジュール402と、
複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するためのビーム周波数相関係数合計取得モジュール403と、
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するための目標ビームデータ選定モジュール404と、を含む。
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、各ビーム周波数の相関係数を正規化処理するための正規化処理サブモジュール4021を含む。
正規化処理された複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するためのビーム周波数相関係数合計取得サブモジュール4031を含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ、又は、複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ及び複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も小さいビームデータを目標ビームデータとして選定するための第1の目標ビームデータ選定サブモジュール4041を含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するための第1の候補ビームデータ選定サブモジュール4042と、
候補ビームデータのエネルギー値を取得するためのエネルギー値取得サブモジュール4043と、
候補ビームデータのエネルギー値が予め設定されたエネルギー値の要求を満たす場合、候補ビームデータを目標ビームデータとして選定するための第2の目標ビームデータ選定サブモジュール4044と、を含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するための第1の候補ビームデータ選定サブモジュール4045と、
候補ビームデータを収集する音声収集モジュールが向けられる方向である候補ビーム収集方向を決定するための候補ビーム収集方向決定サブモジュール4046と、
複数のビームデータ内の少なくとも2組のビームデータに基づいて、音声収集モジュールから音源に向けられる方向である音源方向を決定するための音源方向決定サブモジュール4047と、
候補ビーム収集方向と音源方向との間の角度差が予め設定された角度差以下である場合、候補ビームデータを目標ビームデータとして選定するための第3の目標ビームデータ選定サブモジュール4048と、を含む。
プロセッサ501と、
プロセッサ501により実行可能な命令を記憶するためのメモリ502と、を含み、
プロセッサ501は、
複数のビームデータを取得し、複数のビームデータ内の各ビームデータに対して、周波数サンプリングを行い、
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、ビーム周波数の相関係数が、複数のビームデータ内の一つのビームデータと複数のビームデータ内のもう一つのビームデータとの類似度を示すためのものであり、
複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得し、
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するように構成される。
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得することは、
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、各ビーム周波数の相関係数を正規化処理することを含み、
複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得することは、
正規化処理された複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得することを含むように構成されてもよい。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定することは、
複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ、又は、複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ及び複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も小さいビームデータを目標ビームデータとして選定することを含むように構成されてもよい。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定することは、
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定することと、
候補ビームデータのエネルギー値を取得することと、
候補ビームデータのエネルギー値が予め設定されたエネルギー値の要求を満たす場合、候補ビームデータを目標ビームデータとして選定することと、を含むように構成されてもよい。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定することは、
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定することと、
候補ビーム収集方向を決定し、候補ビーム収集方向が、候補ビームデータを収集する音声収集モジュールが向けられる方向であることと、
複数のビームデータ内の少なくとも2組のビームデータに基づいて、音源方向を決定し、音源方向が音声収集モジュールから音源に向けられる方向であることと、
候補ビーム収集方向と音源方向との間の角度差が予め設定された角度差以下である場合、候補ビームデータを目標ビームデータとして選定することと、を含むように構成されてもよい。
複数のビームデータを取得し、複数のビームデータ内の各ビームデータに対して、周波数サンプリングを行うステップと、
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得するステップであって、ビーム周波数の相関係数が、複数のビームデータ内の一つのビームデータと複数のビームデータ内のもう一つのビームデータとの類似度を示すためのものであるステップと、
複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するステップと、
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するステップと、を含む。
複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、各ビーム周波数の相関係数を正規化処理するステップを含み、
複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するステップは、
正規化処理された複数のビーム周波数の相関係数に基づいて、複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するステップを含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ、又は、複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ及び複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も小さいビームデータを目標ビームデータとして選定するステップを含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するステップと、
候補ビームデータのエネルギー値を取得するステップと、
候補ビームデータのエネルギー値が予め設定されたエネルギー値の要求を満たす場合、候補ビームデータを目標ビームデータとして選定するステップと、を含む。
複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するステップと、
候補ビームデータを収集する音声収集モジュールが向けられる方向である候補ビーム収集方向を決定するステップと、
複数のビームデータ内の少なくとも2組のビームデータに基づいて、音声収集モジュールから音源に向けられる方向である音源方向を決定するステップと、
候補ビーム収集方向と音源方向との間の角度差が予め設定された角度差以下である場合、候補ビームデータを目標ビームデータとして選定するステップと、を含む。
Claims (10)
- 複数のビームデータを取得し、前記複数のビームデータ内の各ビームデータに対して、周波数サンプリングを行うステップと、
前記複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得するステップであって、前記ビーム周波数の相関係数が、前記複数のビームデータ内の一つのビームデータと前記複数のビームデータ内のもう一つのビームデータとの類似度を示すためのものであるステップと、
前記複数のビーム周波数の相関係数に基づいて、前記複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するステップであって、前記各ビームデータに対応するビーム周波数の相関係数の合計とは、前記複数のビーム周波数における各ビームデータと、前記複数のビーム周波数における該ビームデータ以外の他のビームデータにおける各ビームデータとのビーム周波数の相関係数の合計であるステップと、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するステップと、を含み、
前記予め設定された相関係数の要求のビームデータは、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ、又は、前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ及び前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も小さいビームデータである、
ことを特徴とするマルチビーム選定方法。 - 前記複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得するステップは、
前記複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、各前記ビーム周波数の相関係数を正規化処理するステップを含み、
前記複数のビーム周波数の相関係数に基づいて、前記複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するステップは、
正規化処理された複数のビーム周波数の相関係数に基づいて、前記複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するステップを含む、
ことを特徴とする請求項1に記載のマルチビーム選定方法。 - 前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するステップは、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が前記予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するステップと、
前記候補ビームデータのエネルギー値を取得するステップと、
前記候補ビームデータのエネルギー値が予め設定されたエネルギー値の要求を満たす場合、前記候補ビームデータを前記目標ビームデータとして選定するステップと、を含む、
ことを特徴とする請求項1に記載のマルチビーム選定方法。 - 前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するステップは、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が前記予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するステップと、
前記候補ビームデータを収集する音声収集モジュールが向けられる方向である候補ビーム収集方向を決定するステップと、
前記複数のビームデータ内の少なくとも2組のビームデータに基づいて、前記音声収集モジュールから音源に向けられる方向である音源方向を決定するステップと、
前記候補ビーム収集方向と前記音源方向との間の角度差が予め設定された角度差以下である場合、前記候補ビームデータを前記目標ビームデータとして選定するステップと、を含む、
ことを特徴とする請求項1に記載のマルチビーム選定方法。 - 複数のビームデータを取得し、前記複数のビームデータ内の各ビームデータに対して、周波数サンプリングを行うためのビームデータ取得モジュールと、
前記複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得するためのビーム周波数相関係数取得モジュールであって、前記ビーム周波数の相関係数が、前記複数のビームデータ内の一つのビームデータと前記複数のビームデータ内のもう一つのビームデータとの類似度を示すためのものであるビーム周波数相関係数取得モジュールと、
前記複数のビーム周波数の相関係数に基づいて、前記複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するためのビーム周波数相関係数合計取得モジュールであって、前記各ビームデータに対応するビーム周波数の相関係数の合計とは、前記複数のビーム周波数における各ビームデータと、前記複数のビーム周波数における該ビームデータ以外の他のビームデータにおける各ビームデータとのビーム周波数の相関係数の合計であるビーム周波数相関係数合計取得モジュールと、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するための目標ビームデータ選定モジュールと、を含み、
前記予め設定された相関係数の要求のビームデータは、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ、又は、前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ及び前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も小さいビームデータである、
ことを特徴とするマルチビーム選定装置。 - 前記ビーム周波数相関係数取得モジュールは、
前記複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、各前記ビーム周波数の相関係数を正規化処理するための正規化処理サブモジュールを含み、
前記ビーム周波数相関係数合計取得モジュールは、
正規化処理された複数のビーム周波数の相関係数に基づいて、前記複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得するためのビーム周波数相関係数合計取得サブモジュールを含む、
ことを特徴とする請求項5に記載のマルチビーム選定装置。 - 前記目標ビームデータ選定モジュールは、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が前記予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するための第1の候補ビームデータ選定サブモジュールと、
前記候補ビームデータのエネルギー値を取得するためのエネルギー値取得サブモジュールと、
前記候補ビームデータのエネルギー値が予め設定されたエネルギー値の要求を満たす場合、前記候補ビームデータを前記目標ビームデータとして選定するための第2の目標ビームデータ選定サブモジュールと、を含む、
ことを特徴とする請求項5に記載のマルチビーム選定装置。 - 前記目標ビームデータ選定モジュールは、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が前記予め設定された相関係数の要求を満たすビームデータを候補ビームデータとして選定するための第1の候補ビームデータ選定サブモジュールと、
前記候補ビームデータを収集する音声収集モジュールが向けられる方向である候補ビーム収集方向を決定する候補ビーム収集方向決定サブモジュールと、
前記複数のビームデータ内の少なくとも2組のビームデータに基づいて、前記音声収集モジュールから音源に向けられる方向である音源方向を決定するための音源方向決定サブモジュールと、
前記候補ビーム収集方向と前記音源方向との間の角度差が予め設定された角度差以下である場合、前記候補ビームデータを前記目標ビームデータとして選定するための第3の目標ビームデータ選定サブモジュールと、を含む、
ことを特徴とする請求項5に記載のマルチビーム選定装置。 - プロセッサと、
プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、
前記プロセッサは、
複数のビームデータを取得し、前記複数のビームデータ内の各ビームデータに対して、周波数サンプリングを行い、
前記複数のビームデータ内の各ビームデータの周波数サンプリングデータに基づいて、複数のビーム周波数の相関係数を取得し、前記ビーム周波数の相関係数が、前記複数のビームデータ内の一つのビームデータと前記複数のビームデータ内のもう一つのビームデータとの類似度を示すためのものであり、
前記複数のビーム周波数の相関係数に基づいて、前記複数のビームデータ内の各ビームデータに対応するビーム周波数の相関係数の合計を取得し、前記各ビームデータに対応するビーム周波数の相関係数の合計とは、前記複数のビーム周波数における各ビームデータと、前記複数のビーム周波数における該ビームデータ以外の他のビームデータにおける各ビームデータとのビーム周波数の相関係数の合計であり、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が予め設定された相関係数の要求を満たすビームデータを目標ビームデータとして選定するように構成され、
前記予め設定された相関係数の要求のビームデータは、
前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ、又は、前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も大きいビームデータ及び前記複数のビームデータ内の対応するビーム周波数の相関係数の合計が最も小さいビームデータである、
ことを特徴とするマルチビーム選定装置。 - コンピュータ命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、
当該命令がプロセッサによって実行されるとき、請求項1〜4のいずれかに記載の方法のステップを実現する、
ことを特徴とするコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811385651.1A CN109599104B (zh) | 2018-11-20 | 2018-11-20 | 多波束选取方法及装置 |
CN201811385651.1 | 2018-11-20 | ||
PCT/CN2019/077022 WO2020103353A1 (zh) | 2018-11-20 | 2019-03-05 | 多波束选取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021509963A JP2021509963A (ja) | 2021-04-08 |
JP6964666B2 true JP6964666B2 (ja) | 2021-11-10 |
Family
ID=65958757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019528751A Active JP6964666B2 (ja) | 2018-11-20 | 2019-03-05 | マルチビーム選定方法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11337173B2 (ja) |
EP (1) | EP3657497B1 (ja) |
JP (1) | JP6964666B2 (ja) |
KR (1) | KR102240490B1 (ja) |
CN (1) | CN109599104B (ja) |
RU (1) | RU2717912C1 (ja) |
WO (1) | WO2020103353A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109599104B (zh) * | 2018-11-20 | 2022-04-01 | 北京小米智能科技有限公司 | 多波束选取方法及装置 |
CN111833901B (zh) * | 2019-04-23 | 2024-04-05 | 北京京东尚科信息技术有限公司 | 音频处理方法、音频处理装置、系统及介质 |
CN110364161A (zh) | 2019-08-22 | 2019-10-22 | 北京小米智能科技有限公司 | 响应语音信号的方法、电子设备、介质及系统 |
US11990973B2 (en) * | 2020-04-20 | 2024-05-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Beam management for a radio transceiver device |
CN112492452B (zh) * | 2020-11-26 | 2022-08-26 | 北京字节跳动网络技术有限公司 | 波束系数存储方法、装置、设备和存储介质 |
EP4210350A4 (en) * | 2021-11-19 | 2023-12-13 | Shenzhen Shokz Co., Ltd. | OPEN ACOUSTIC DEVICE |
US20240062774A1 (en) * | 2022-08-17 | 2024-02-22 | Caterpillar Inc. | Detection of audio communication signals present in a high noise environment |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2861011B2 (ja) * | 1989-01-11 | 1999-02-24 | アイシン精機株式会社 | 音声入力方法及び装置 |
US7415117B2 (en) * | 2004-03-02 | 2008-08-19 | Microsoft Corporation | System and method for beamforming using a microphone array |
US7426464B2 (en) * | 2004-07-15 | 2008-09-16 | Bitwave Pte Ltd. | Signal processing apparatus and method for reducing noise and interference in speech communication and speech recognition |
EP3296992B1 (en) * | 2008-03-20 | 2021-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for modifying a parameterized representation |
JP2011257627A (ja) * | 2010-06-10 | 2011-12-22 | Murata Mach Ltd | 音声認識装置と認識方法 |
GB2495129B (en) * | 2011-09-30 | 2017-07-19 | Skype | Processing signals |
US20130329908A1 (en) * | 2012-06-08 | 2013-12-12 | Apple Inc. | Adjusting audio beamforming settings based on system state |
KR20140108788A (ko) * | 2013-02-28 | 2014-09-15 | 경북대학교 산학협력단 | 단일 마이크로폰을 이용한 접촉식 인터페이스 장치 |
US9489965B2 (en) * | 2013-03-15 | 2016-11-08 | Sri International | Method and apparatus for acoustic signal characterization |
WO2014175591A1 (ko) * | 2013-04-27 | 2014-10-30 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호처리 방법 |
KR101491354B1 (ko) * | 2013-11-25 | 2015-02-06 | 현대자동차주식회사 | 음성인식 장치 및 방법 |
KR102146462B1 (ko) * | 2014-03-31 | 2020-08-20 | 삼성전자주식회사 | 음성 인식 시스템 및 방법 |
CN105590631B (zh) * | 2014-11-14 | 2020-04-07 | 中兴通讯股份有限公司 | 信号处理的方法及装置 |
KR102346302B1 (ko) * | 2015-02-16 | 2022-01-03 | 삼성전자 주식회사 | 전자 장치 및 음성 인식 기능 운용 방법 |
CN104810021B (zh) * | 2015-05-11 | 2017-08-18 | 百度在线网络技术(北京)有限公司 | 应用于远场识别的前处理方法和装置 |
US9820036B1 (en) * | 2015-12-30 | 2017-11-14 | Amazon Technologies, Inc. | Speech processing of reflected sound |
US9653060B1 (en) * | 2016-02-09 | 2017-05-16 | Amazon Technologies, Inc. | Hybrid reference signal for acoustic echo cancellation |
CN105791611B (zh) * | 2016-02-22 | 2020-07-07 | 腾讯科技(深圳)有限公司 | 回声消除方法、装置、终端以及存储介质 |
CN106023996B (zh) * | 2016-06-12 | 2019-08-27 | 杭州电子科技大学 | 基于十字形声阵列宽带波束形成的声识别方法 |
US9972337B2 (en) * | 2016-06-22 | 2018-05-15 | Cisco Technology, Inc. | Acoustic echo cancellation with delay uncertainty and delay change |
JP6387151B2 (ja) * | 2016-09-30 | 2018-09-05 | パナソニック株式会社 | 雑音抑圧装置、及び、雑音抑圧方法 |
KR20180103634A (ko) * | 2017-03-10 | 2018-09-19 | 주식회사 쿨잼컴퍼니 | 통계적 방법에 의한 음향 분석 및 비교 |
KR20180103639A (ko) * | 2017-03-11 | 2018-09-19 | 주식회사 쿨잼컴퍼니 | 상대적 유사도에 기초한 음악 시퀀스들의 유사도 분석 |
CN106952653B (zh) * | 2017-03-15 | 2021-05-04 | 科大讯飞股份有限公司 | 噪声去除方法、装置和终端设备 |
CN107274911A (zh) * | 2017-05-03 | 2017-10-20 | 昆明理工大学 | 一种基于声音特征的相似度分析方法 |
CN107221320A (zh) * | 2017-05-19 | 2017-09-29 | 百度在线网络技术(北京)有限公司 | 训练声学特征提取模型的方法、装置、设备和计算机存储介质 |
US10051366B1 (en) * | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
CN108122563B (zh) * | 2017-12-19 | 2021-03-30 | 北京声智科技有限公司 | 提高语音唤醒率及修正doa的方法 |
CN108181612B (zh) * | 2017-12-22 | 2019-05-21 | 达闼科技(北京)有限公司 | 确定麦克风波束成型角度的方法及相关装置 |
CN108717495A (zh) * | 2018-05-22 | 2018-10-30 | 出门问问信息科技有限公司 | 多波束波束成形的方法、装置及电子设备 |
US10622004B1 (en) * | 2018-08-20 | 2020-04-14 | Amazon Technologies, Inc. | Acoustic echo cancellation using loudspeaker position |
CN109599104B (zh) * | 2018-11-20 | 2022-04-01 | 北京小米智能科技有限公司 | 多波束选取方法及装置 |
-
2018
- 2018-11-20 CN CN201811385651.1A patent/CN109599104B/zh active Active
-
2019
- 2019-03-05 RU RU2019127676A patent/RU2717912C1/ru active
- 2019-03-05 KR KR1020197017626A patent/KR102240490B1/ko active IP Right Grant
- 2019-03-05 JP JP2019528751A patent/JP6964666B2/ja active Active
- 2019-03-05 WO PCT/CN2019/077022 patent/WO2020103353A1/zh active Application Filing
- 2019-08-29 US US16/555,237 patent/US11337173B2/en active Active
- 2019-08-29 EP EP19194373.7A patent/EP3657497B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11337173B2 (en) | 2022-05-17 |
JP2021509963A (ja) | 2021-04-08 |
KR102240490B1 (ko) | 2021-04-15 |
EP3657497A1 (en) | 2020-05-27 |
WO2020103353A1 (zh) | 2020-05-28 |
US20200163038A1 (en) | 2020-05-21 |
EP3657497B1 (en) | 2024-01-10 |
RU2717912C1 (ru) | 2020-03-26 |
KR20200063095A (ko) | 2020-06-04 |
CN109599104A (zh) | 2019-04-09 |
CN109599104B (zh) | 2022-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6964666B2 (ja) | マルチビーム選定方法及び装置 | |
CN108510987B (zh) | 语音处理方法及装置 | |
CN108766457B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
EP3091753A1 (en) | Method and device of optimizing sound signal | |
CN105631803B (zh) | 滤镜处理的方法和装置 | |
US10027785B2 (en) | Method for switching screen state of terminal, terminal thereof, and computer-readable medium thereof | |
CN111553464B (zh) | 基于超网络的图像处理方法、装置及智能设备 | |
US11178501B2 (en) | Methods, devices, and computer-readable medium for microphone selection | |
CN108307308B (zh) | 无线局域网设备的定位方法、装置和存储介质 | |
CN111863012B (zh) | 一种音频信号处理方法、装置、终端及存储介质 | |
CN112185388B (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
CN112019948B (zh) | 一种对讲设备通信的方法、对讲设备和存储介质 | |
CN110298261A (zh) | 静脉识别方法及相关产品 | |
CN107665340B (zh) | 指纹识别方法、装置、电子设备 | |
CN112752191A (zh) | 音频采集方法、装置及存储介质 | |
CN111918170A (zh) | 拾音方式切换方法、装置和电子设备 | |
CN111986688B (zh) | 一种提高语音清晰度的方法、装置及介质 | |
CN116705047B (zh) | 音频采集方法、装置及存储介质 | |
CN112462928B (zh) | 操作执行方法、装置及存储介质 | |
CN112804462B (zh) | 多点对焦成像方法及装置、移动终端、存储介质 | |
CN110632600B (zh) | 环境识别方法和装置 | |
CN117636893A (zh) | 风噪检测方法、装置、可穿戴设备及可读储存介质 | |
CN116097349A (zh) | 电子设备的语音唤醒方法、装置、存储介质及芯片 | |
CN117877507A (zh) | 语音信号增强方法、装置、电子设备和存储介质 | |
CN112883849A (zh) | 识别手势的方法、装置、存储介质及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190911 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211008 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6964666 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |