JP7233035B2 - 収音装置、収音方法、及びプログラム - Google Patents
収音装置、収音方法、及びプログラム Download PDFInfo
- Publication number
- JP7233035B2 JP7233035B2 JP2019539014A JP2019539014A JP7233035B2 JP 7233035 B2 JP7233035 B2 JP 7233035B2 JP 2019539014 A JP2019539014 A JP 2019539014A JP 2019539014 A JP2019539014 A JP 2019539014A JP 7233035 B2 JP7233035 B2 JP 7233035B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- position information
- weight
- unit
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/18—Methods or devices for transmitting, conducting or directing sound
- G10K11/26—Sound-focusing or directing, e.g. scanning
- G10K11/34—Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
- H04R29/005—Microphone arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Circuit For Audible Band Transducer (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
- Software Systems (AREA)
Description
特許文献1の推定装置において、談話参加者が発話した確率を精度良く算出するためには、カメラから出力される映像信号から得られる情報とマイクロホンから出力される音響信号から得られる情報とが正確である必要がある。よって、映像信号から得られる情報と音響信号から得られる情報とが正確でない場合には、談話参加者が発話した確率を精度良く算出することができない。
以下、第1実施形態について、図面を参照しながら説明する。本実施形態では、人物の音声を目的音として収音する例について説明する。本実施形態では、カメラの撮影状況に応じた重みは、人物の顔が画像データに含まれている確からしさを示す確度に基づいて、設定される。また、マイクアレイの受音状況に応じた重みは、目的音が音響信号に含まれている確からしさを示す確度に基づいて、設定される。「確度」とは、確実さの度合いのことである。
図1は、本開示の第1実施形態の収音装置の構成を示している。収音装置1は、カメラ10、マイクアレイ20、制御部30、記憶部40、入出力インタフェース部50、及びバス60を備える。収音装置1は、例えば、会議中の人の音声を収音する。収音装置1は、一例では、カメラ10、マイクアレイ20、制御部30、記憶部40、入出力インタフェース部50、及びバス60が一体化された専用の収音機である。
図4は、制御部30による収音動作を示している。
本開示の収音装置1は、音源となる物体から出力される目的音を収音するための収音装置である。収音装置1は、カメラ10によって生成された画像データvの入力を受ける第1の入力部(制御部30、または入出力インタフェース部50)と、マイクアレイ20から出力される音響信号sの入力を受ける第2の入力部(制御部30、または入出力インタフェース部50)と、画像データv及び音響信号sに基づいて収音する方向θ,φを決定する制御部30と、を有する。制御部30は、物体位置検出部31と、音源位置推定部32と、重み付け部300と、収音方向決定部36とを含む。物体位置検出部31は、画像データvに基づいて、物体の水平方向又は垂直方向の少なくともいずれか一方における位置を検出し、検出した物体の位置を示す情報である物体位置情報P(θ,φ|v)を出力する。音源位置推定部32は、音響信号sに基づいて、音源の水平方向又は垂直方向の少なくともいずれか一方における位置を推定し、推定した音源の位置を示す情報である音源位置情報P(θ,φ|s)を出力する。重み付け部300は、物体位置情報に対してカメラ10の撮影状況に応じた重みWvを設定し、且つ音源位置情報に対してマイクアレイ20の受音状況に応じた重みWsを設定する。収音方向決定部36は、物体位置情報P(θ,φ|v)と物体位置情報の重みWvと音源位置情報P(θ,φ|s)と音源位置情報の重みWsとに基づいて、収音する方向θ,φを決定する。
本実施形態の収音装置1は、物体位置情報の重みWvをセンサの出力に基づいて設定する。
本実施形態の収音装置1は、画像データvから発話区間を検出して収音を制御する。
本実施形態の収音装置1は、画像データvの複数の領域毎に、顔の確率Pに重みWvを設定する。以下、図2および図17を参照して、本実施形態を説明する。
以上のように、本出願において開示する技術の例示として、第1~第4実施形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施形態にも適用可能である。また、上記第1~第4実施形態で説明した各構成要素を組み合わせて、新たな実施形態とすることも可能である。そこで、以下、他の実施形態を例示する。
(1)本開示の収音装置は、音源となる物体から出力される目的音を収音するための収音装置であって、カメラによって生成された画像データ(v)の入力を受ける第1の入力部と、マイクアレイから出力される音響信号(s)の入力を受ける第2の入力部と、画像データ(v)及び音響信号(s)に基づいて、目的音を収音する方向(θ,φ)を決定する制御部と、を有する。制御部は、検出部と、推定部と、重み付け部と、決定部とを含む。検出部は、画像データ(v)に基づいて、物体の水平方向又は垂直方向の少なくともいずれか一方における位置を検出し、検出した物体の位置を示す情報である物体位置情報(P(θ,φ|v))を出力する。推定部は、音響信号(s)に基づいて、音源の水平方向又は垂直方向の少なくともいずれか一方における位置を推定し、推定した音源の位置を示す情報である音源位置情報(P(θ,φ|s))を出力する。重み付け部は、物体位置情報に対してカメラの撮影状況に応じた重み(Wv)を設定する。決定部は、物体位置情報(P(θ,φ|v))と物体位置情報の重み(Wv)と音源位置情報(P(θ,φ|s))とに基づいて、目的音を収音する方向(θ,φ)を決定する。
10 カメラ
20 マイクアレイ
30 制御部
31 物体位置検出部
32 音源位置推定部
33 画像確度判定部
34 音響確度判定部
35 重み設定部
36 収音方向決定部
37 ビームフォーム部
38 発話区間検出部
40 記憶部
50 入出力インタフェース部
60 バス
70 センサ部
300 重み付け部
Claims (11)
- 物体から出力される目的音を収音するための収音装置であって、
カメラによって生成された画像データの入力を受ける第1の入力部と、
マイクアレイから出力される前記目的音と非目的音を含む音響信号の入力を受ける第2の入力部と、
前記目的音を収音する方向を決定する制御部と、
を有し、
前記制御部は、
前記画像データ内の部分領域が前記物体の特徴と一致する確率に基づいて、前記物体の水平方向又は垂直方向の少なくともいずれか一方における位置を検出し、検出した前記物体の位置を示す情報である物体位置情報を出力する検出部と、
前記音響信号内の所定の位置に前記目的音または非目的音の音源が存在する確率に基づいて、前記音源の水平方向又は垂直方向の少なくともいずれか一方における位置を推定し、推定した前記音源の位置を示す情報である音源位置情報を出力する推定部と、
前記目的音の情報である第1情報と前記音響信号に含まれる音との第1尤度に応じて、前記音源位置情報の重みを設定する重み付け部と、
前記物体位置情報と前記音源位置情報と前記音源位置情報の重みとに基づいて、前記目的音を収音する方向を決定する決定部と、
を含む、収音装置。 - 前記第1情報を収納する記憶部を含む、
請求項1に記載の収音装置。 - 前記記憶部は、前記非目的音の情報である第2情報を収納し、
前記重み付け部は、前記第1尤度と前記非目的音の前記第2情報による尤度との比に基づいて、前記音源位置情報の重みを設定する、
請求項2に記載の収音装置。 - 前記重み付け部は、前記画像データから前記物体の位置を検出する精度が変化する前記カメラの撮影状況に応じて、前記物体位置情報の重みを設定し、
前記決定部は、前記物体位置情報と前記物体位置情報の重みと前記音源位置情報と前記音源位置情報の重みに基づいて、前記目的音を収音する方向を決定する、
請求項1~3のいずれかに記載の収音装置。 - 前記重み付け部は、
前記物体が前記画像データに含まれている確からしさを示す画像確度に基づいて前記物体位置情報の重みを設定する、
請求項4に記載の収音装置。 - 前記重み付け部は、前記画像データの平均輝度又は輝度の分散に基づいて、前記画像確度を算出する、
請求項5に記載の収音装置。 - 前記検出部は、前記画像データを複数の領域に分割し、
前記重み付け部は、前記複数の領域のうち、検出した前記物体の位置に対応する一の領域の平均輝度又は輝度の分散に基づいて、前記画像確度を算出する、
請求項5に記載の収音装置。 - 周囲の明るさを検知する輝度センサ、前記物体までの距離を検知する距離センサ、又は加速度センサのうちの少なくとも1つを含むセンサ部をさらに有し、
前記重み付け部は、前記センサ部の出力に基づいて、前記物体位置情報の重みを設定する、
請求項1に記載の収音装置。 - 前記カメラ又は前記マイクアレイのうちの少なくとも一方を備える、
請求項1に記載の収音装置。 - 物体から出力される目的音を収音するための収音方法であって、
カメラによって生成された画像データの入力を受けるステップと、
マイクアレイから出力される前記目的音と非目的音を含む音響信号の入力を受けるステップと、
前記画像データ内の部分領域が前記物体の特徴と一致する確率に基づいて、前記物体の水平方向又は垂直方向の少なくともいずれか一方における位置を検出し、検出した前記物体の位置を示す情報である物体位置情報を出力するステップと、
前記音響信号内の所定の位置に前記目的音または非目的音の音源が存在する確率に基づいて、前記音源の水平方向又は垂直方向の少なくともいずれか一方における位置を推定し、推定した前記音源の位置を示す情報である音源位置情報を出力するステップと、
前記目的音の情報である第1情報と前記音響信号に含まれる音との第1尤度に応じて、前記音源位置情報の重みを設定するステップと、
前記物体位置情報と前記音源位置情報と前記音源位置情報の重みとに基づいて、前記目的音を収音する方向を決定するステップと、
を含む、収音方法。 - コンピュータに請求項10に記載の収音方法を実行させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017165717 | 2017-08-30 | ||
JP2017165717 | 2017-08-30 | ||
PCT/JP2018/024996 WO2019044157A1 (ja) | 2017-08-30 | 2018-07-02 | 収音装置、収音方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019044157A1 JPWO2019044157A1 (ja) | 2020-08-20 |
JP7233035B2 true JP7233035B2 (ja) | 2023-03-06 |
Family
ID=65525027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019539014A Active JP7233035B2 (ja) | 2017-08-30 | 2018-07-02 | 収音装置、収音方法、及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11330367B2 (ja) |
EP (1) | EP3678385B1 (ja) |
JP (1) | JP7233035B2 (ja) |
CN (1) | CN111034222B (ja) |
WO (1) | WO2019044157A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210038537A (ko) * | 2018-07-24 | 2021-04-07 | 소니 주식회사 | 정보 처리 장치 및 방법, 그리고 프로그램 |
US10997424B2 (en) | 2019-01-25 | 2021-05-04 | Gracenote, Inc. | Methods and systems for sport data extraction |
US11036995B2 (en) * | 2019-01-25 | 2021-06-15 | Gracenote, Inc. | Methods and systems for scoreboard region detection |
US11087161B2 (en) | 2019-01-25 | 2021-08-10 | Gracenote, Inc. | Methods and systems for determining accuracy of sport-related information extracted from digital video frames |
US11805283B2 (en) | 2019-01-25 | 2023-10-31 | Gracenote, Inc. | Methods and systems for extracting sport-related information from digital video frames |
US11010627B2 (en) | 2019-01-25 | 2021-05-18 | Gracenote, Inc. | Methods and systems for scoreboard text region detection |
CN111544030B (zh) * | 2020-05-20 | 2023-06-20 | 京东方科技集团股份有限公司 | 一种听诊器、诊断装置及诊断方法 |
CN111866439B (zh) * | 2020-07-21 | 2022-07-05 | 厦门亿联网络技术股份有限公司 | 一种优化音视频体验的会议装置、系统及其运行方法 |
CN112015364B (zh) * | 2020-08-26 | 2024-08-09 | 广州视源电子科技股份有限公司 | 拾音灵敏度的调整方法、装置 |
CN114374903B (zh) * | 2020-10-16 | 2023-04-07 | 华为技术有限公司 | 拾音方法和拾音装置 |
CN112735457B (zh) * | 2020-12-11 | 2022-05-17 | 中国汽车技术研究中心有限公司 | 语音去噪方法和系统 |
JP2022119582A (ja) * | 2021-02-04 | 2022-08-17 | 株式会社日立エルジーデータストレージ | 音声取得装置および音声取得方法 |
CN117496997B (zh) * | 2023-12-27 | 2024-04-05 | 湘江实验室 | 基于惩罚机制的声源检测方法、装置及存储介质 |
CN118338171B (zh) * | 2024-06-13 | 2024-09-10 | 广东鼎创智造科技有限公司 | 一种用于麦克风的使用权限管理方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012042454A (ja) | 2010-08-17 | 2012-03-01 | Honda Motor Co Ltd | 位置検出装置及び位置検出方法 |
JP2012512413A (ja) | 2008-12-16 | 2012-05-31 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パーティクルフィルタリングを利用した音源位置の推定 |
JP2016521894A (ja) | 2013-06-14 | 2016-07-25 | クアルコム,インコーポレイテッド | 検出されたジェスチャーに基づいてデバイス動作を実行するためのシステムおよび方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5215826B1 (ja) | 1971-04-13 | 1977-05-04 | ||
JPH05227531A (ja) * | 1992-02-17 | 1993-09-03 | Sanyo Electric Co Ltd | カメラ監視システム |
JP4490076B2 (ja) * | 2003-11-10 | 2010-06-23 | 日本電信電話株式会社 | 物体追跡方法、物体追跡装置、プログラム、および、記録媒体 |
JP2006126342A (ja) * | 2004-10-27 | 2006-05-18 | Honda Motor Co Ltd | 音声認識システム、この音声認識システムを備える移動体及び車両 |
JP2009031951A (ja) * | 2007-07-25 | 2009-02-12 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
JP4926091B2 (ja) * | 2008-02-19 | 2012-05-09 | 株式会社日立製作所 | 音響ポインティングデバイス、音源位置のポインティング方法及びコンピュータシステム |
JP6240995B2 (ja) * | 2013-01-15 | 2017-12-06 | 株式会社国際電気通信基礎技術研究所 | 移動体、音響源マップ作成システムおよび音響源マップ作成方法 |
JP6157598B2 (ja) * | 2013-04-12 | 2017-07-05 | 株式会社日立製作所 | 移動ロボット、及び、音源位置推定システム |
US10721384B2 (en) * | 2014-03-27 | 2020-07-21 | Sony Corporation | Camera with radar system |
JP6464449B2 (ja) * | 2014-08-29 | 2019-02-06 | 本田技研工業株式会社 | 音源分離装置、及び音源分離方法 |
KR102186137B1 (ko) * | 2015-08-21 | 2020-12-03 | 현대자동차주식회사 | 차량 정보 기반 센서퓨전 시스템 |
JP6684608B2 (ja) * | 2016-02-19 | 2020-04-22 | 学校法人 中央大学 | 音場制御装置、音場制御システム及び音場制御方法 |
US10467509B2 (en) * | 2017-02-14 | 2019-11-05 | Microsoft Technology Licensing, Llc | Computationally-efficient human-identifying smart assistant computer |
-
2018
- 2018-07-02 CN CN201880054599.3A patent/CN111034222B/zh active Active
- 2018-07-02 EP EP18850643.0A patent/EP3678385B1/en active Active
- 2018-07-02 JP JP2019539014A patent/JP7233035B2/ja active Active
- 2018-07-02 WO PCT/JP2018/024996 patent/WO2019044157A1/ja unknown
-
2019
- 2019-12-30 US US16/730,982 patent/US11330367B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012512413A (ja) | 2008-12-16 | 2012-05-31 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パーティクルフィルタリングを利用した音源位置の推定 |
JP2012042454A (ja) | 2010-08-17 | 2012-03-01 | Honda Motor Co Ltd | 位置検出装置及び位置検出方法 |
JP2016521894A (ja) | 2013-06-14 | 2016-07-25 | クアルコム,インコーポレイテッド | 検出されたジェスチャーに基づいてデバイス動作を実行するためのシステムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200137491A1 (en) | 2020-04-30 |
CN111034222A (zh) | 2020-04-17 |
CN111034222B (zh) | 2024-08-02 |
US11330367B2 (en) | 2022-05-10 |
WO2019044157A1 (ja) | 2019-03-07 |
EP3678385B1 (en) | 2023-01-04 |
JPWO2019044157A1 (ja) | 2020-08-20 |
EP3678385A1 (en) | 2020-07-08 |
EP3678385A4 (en) | 2020-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7233035B2 (ja) | 収音装置、収音方法、及びプログラム | |
CN111370014B (zh) | 多流目标-语音检测和信道融合的系统和方法 | |
JP6464449B2 (ja) | 音源分離装置、及び音源分離方法 | |
EP3480820B1 (en) | Electronic device and method for processing audio signals | |
CN106653041B (zh) | 音频信号处理设备、方法和电子设备 | |
JP7370014B2 (ja) | 収音装置、収音方法、及びプログラム | |
US9881610B2 (en) | Speech recognition system adaptation based on non-acoustic attributes and face selection based on mouth motion using pixel intensities | |
US10535361B2 (en) | Speech enhancement using clustering of cues | |
US20220148611A1 (en) | Speech enhancement using clustering of cues | |
JP2020092358A (ja) | 信号処理装置及び信号処理方法 | |
JP7515121B2 (ja) | 発話区間検出装置、発話区間検出方法、および発話区間検出プログラム | |
Nakadai et al. | Footstep detection and classification using distributed microphones | |
US12033654B2 (en) | Sound pickup device and sound pickup method | |
JP7279710B2 (ja) | 信号処理装置および方法、並びにプログラム | |
KR20140095853A (ko) | 발화자의 거리 추정을 이용한 음성인식방법 및 음성인식장치 | |
Choi et al. | Real-time audio-visual localization of user using microphone array and vision camera | |
CN114339113A (zh) | 视频通话方法及相关装置、设备和存储介质 | |
CN117392995A (zh) | 基于多模态的话者分离方法、装置、设备及存储介质 | |
Ishi et al. | Sound interval detection of multiple sources based on sound directivity | |
Ma et al. | Incorporating localisation cues in a fragment decoding framework for distant binaural speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A5211 Effective date: 20191018 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230210 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7233035 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |