JP2009021764A - 音声通信装置及び音声通信方法並びにプログラム - Google Patents
音声通信装置及び音声通信方法並びにプログラム Download PDFInfo
- Publication number
- JP2009021764A JP2009021764A JP2007182068A JP2007182068A JP2009021764A JP 2009021764 A JP2009021764 A JP 2009021764A JP 2007182068 A JP2007182068 A JP 2007182068A JP 2007182068 A JP2007182068 A JP 2007182068A JP 2009021764 A JP2009021764 A JP 2009021764A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- sound source
- sound
- reproduction information
- base
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims description 87
- 230000035945 sensitivity Effects 0.000 claims abstract description 234
- 230000005540 biological transmission Effects 0.000 claims description 38
- 238000001514 detection method Methods 0.000 description 31
- 230000004807 localization Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 15
- 230000003321 amplification Effects 0.000 description 12
- 238000003199 nucleic acid amplification method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000003825 pressing Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000002238 attenuated effect Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 230000001629 suppression Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】複数の拠点間で音声通信を行う音声通信装置であって、音声を収集する集音素子を複数備えたマイクロホンアレイが収集した音声から音源の方位を特定する音源方位特定部と、収集した音声を他の拠点へ送信する音声送信部と、他の拠点からの音声を受信する音声受信部と、受信した音声を再生する再生部と、再生中の音声に対する再生情報を設定する再生情報設定部と、再生情報を設定した音源の方位を前記音源方位特定部から取得して、当該音源の方位と再生情報を対応付けて格納する話者感度情報格納部と、話者感度情報格納部から再生中の音声の音源の方位に対応する再生情報を取得し、当該再生情報に基づいて音声を変更する音声変更部と、を備える。
【選択図】図6
Description
に関する。
E(f,τ)=[E_0(f,τ)、E_1(f,τ),…,E_M−1(f、τ)]
とベクトル形式に変換する。また音源定位部608では、音源到来方向をθ、音源位置での振幅レベルを1と仮定したときのマイクロホン素子iへの入力信号を、Aθ_i(f)と表記する。
Aθ(f)=[Aθ_0(f,τ),Aθ_1(f,τ),…,Aθ_M−1(f,τ)]
とベクトル化する。ここで、Aθ(f)の2乗ノルムを1に正規化し、かつAθ_0(f、τ)の位相成分を0に正規化したものを同じ変数名Aθ(f)で表記する。計算機101の環境の室温が一定の場合、音は、物理空間を一定の音速C[m/s]で伝わると仮定できる。また音源から各方向に均一に音が放射されると仮定すると、エネルギー保存の法則から、音源パワーは距離の2乗に反比例して減衰する。つまり振幅は距離に比例して減衰する。このことから、マイクロホン素子iへの入力信号Aθ(f)はマイク配置615から計算することができる。もし周波数領域信号E_i(f,τ)が音源方向θから到来する成分のみで構成されているとすると、
E_i(f,τ)=S(f,τ)Aθ(f)
となるはずである。上記S(f、τ)はスカラー量である。ここで、到来方向φ≠θとする。Aθ(f)の2乗ノルムが1で正規化されていることから、次の、数3が成立する。
図13〜図17は、第2の実施形態を示し、前記第1実施形態の図2に示したように拠点間にサーバ10を備えた構成で、サーバ10において感度(音量)調整を行うようにしたものである。
図18〜図20は、第3の実施形態を示し、前記第1実施形態の図3に示したように拠点間で直接通信を行い、受信側の拠点において感度(音量)調整を行うようにしたものである。
本発明の構成は、テレビ会議システムに限らず、携帯電話のテレビ電話やカーナビゲーション装置のハンズフリー通話装置に、適用可能である。
12.ネットワークで接続された第1の拠点と第2の拠点とを含む複数の拠点間で音声通信を行う音声通信方法であって、
前記第2の拠点が、前記第1の拠点から音声を受信するステップと、
前記第2の拠点が、前記受信した音声を再生するステップと、
前記第2の拠点が、前記再生中の音声に対する再生情報を設定するステップと、
前記第2の拠点が、前記再生情報を前記第1の拠点へ送信するステップと、
前記第1の拠点が、マイクロホンアレイの複数の集音素子で収集した音声から第1の拠点における音源の方位を特定するステップと、
前記第1の拠点が、前記第2の拠点から再生情報を受信するステップと、
前記第1の拠点が、前記第2の拠点へ送信中の音源の方位と前記受信した再生情報を対応付けて話者感度情報格納部へ格納するステップと、
前記第1の拠点が、前記音源の方位に対応する再生情報を前記話者感度情報格納部から取得して、前記収集した音声を前記取得した再生情報に基づいて変更するステップと、
前記第1の拠点が、前記変更された音声を前記第2の拠点へ送信するステップと、
を含むことを特徴とする音声通信方法。
前記第1の拠点が、マイクロホンアレイの複数の集音素子で収集した音声から第1の拠点における音源の方位を特定するステップと、
前記第1の拠点が、前記収集した音声と前記特定した音源の方位を第2の拠点へ送信するステップと、
前記第2の拠点が、前記第1の拠点から音声と音源の方位を受信するステップと、
前記第2の拠点が、前記受信した音声を再生するステップと、
前記第2の拠点が、前記再生中の音声に対する再生情報を設定するステップと、
前記第2の拠点が、前記設定された再生情報と受信した音源の方位とを対応付けて話者感度情報格納部へ格納するステップと、
前記第2の拠点が、前記話者感度情報格納部から再生中の音声の音源の方位に対応する再生情報を取得し、当該再生情報に基づいて音声を変更するステップと、
を含むことを特徴とする音声通信方法。
前記第1の拠点が、マイクロホンアレイの複数の集音素子で収集した音声から第1の拠点における音源の方位を特定するステップと、
前記第1の拠点が、前記収集した音声と前記特定した音源の方位を前記サーバへ送信するステップと、を有し、
前記第2の拠点が、前記サーバから音声を受信するステップと、
前記第2の拠点が、前記受信した音声を再生するステップと、
前記第2の拠点が、前記再生中の音声に対する再生情報を設定するステップと、
前記第2の拠点が、前記再生情報を前記サーバへ送信するステップと、
前記サーバが、前記第1の拠点から音声と音源の方位を受信するステップと、
前記サーバが、前記第2の拠点から再生情報を受信するステップと、
前記サーバが、前記第1の拠点から受信した音源の方位と前記第2の拠点から受信した再生情報を対応付けて話者感度情報格納部へ格納するステップと、
前記サーバが、前記音源の方位に対応する再生情報を前記話者感度情報格納部から取得して、前記受信した音声を前記取得した再生情報に基づいて変更するステップと、
前記サーバが、前記音声変更部で変更された音声を前記第2の拠点へ送信するステップと、を含むことを特徴とする音声通信方法。
15.ネットワークで接続された第1の拠点の計算機と第2の拠点の計算機とを含む複数の拠点間で音声通信を行う音声通信方法であって、
前記第2の拠点の計算機が、前記第1の拠点から音声を受信する処理と、
前記第2の拠点の計算機が、前記受信した音声を再生する処理と、
前記第2の拠点の計算機が、前記再生中の音声に対する再生情報を設定する処理と、
前記第2の拠点の計算機が、前記再生情報を前記第1の拠点へ送信する処理と、
前記第1の拠点の計算機が、マイクロホンアレイの複数の集音素子で収集した音声から第1の拠点における音源の方位を特定する処理と、
前記第1の拠点の計算機が、前記第2の拠点から再生情報を受信する処理と、
前記第1の拠点の計算機が、前記第2の拠点へ送信中の音源の方位と前記受信した再生情報を対応付けて話者感度情報格納部へ格納する処理と、
前記第1の拠点の計算機が、前記音源の方位に対応する再生情報を前記話者感度情報格納部から取得して、前記収集した音声を前記取得した再生情報に基づいて変更する処理と、
前記第1の拠点の計算機が、前記変更された音声を前記第2の拠点へ送信する処理と、
を前記計算機に機能させることを特徴とするプログラム。
前記第1の拠点の計算機が、マイクロホンアレイの複数の集音素子で収集した音声から第1の拠点における音源の方位を特定する処理と、
前記第1の拠点の計算機が、前記収集した音声と前記特定した音源の方位を第2の拠点へ送信する処理と、
前記第2の拠点の計算機が、前記第1の拠点から音声と音源の方位を受信する処理と、
前記第2の拠点の計算機が、前記受信した音声を再生する処理と、
前記第2の拠点の計算機が、前記再生中の音声に対する再生情報を設定する処理と、
前記第2の拠点の計算機が、前記設定された再生情報と受信した音源の方位とを対応付けて話者感度情報格納部へ格納する処理と、
前記第2の拠点の計算機が、前記話者感度情報格納部から再生中の音声の音源の方位に対応する再生情報を取得し、当該再生情報に基づいて音声を変更する処理と、
を含むことを特徴とする音声通信方法。
前記第1の拠点の計算機が、マイクロホンアレイの複数の集音素子で収集した音声から第1の拠点における音源の方位を特定する処理と、
前記第1の拠点の計算機が、前記収集した音声と前記特定した音源の方位を前記サーバへ送信する処理と、を有し、
前記第2の拠点の計算機が、前記サーバから音声を受信する処理と、
前記第2の拠点の計算機が、前記受信した音声を再生する処理と、
前記第2の拠点の計算機が、前記再生中の音声に対する再生情報を設定する処理と、
前記第2の拠点の計算機が、前記再生情報を前記サーバへ送信する処理と、
前記サーバが、前記第1の拠点から音声と音源の方位を受信する処理と、
前記サーバが、前記第2の拠点から再生情報を受信する処理と、
前記サーバが、前記第1の拠点から受信した音源の方位と前記第2の拠点から受信した再生情報を対応付けて話者感度情報格納部へ格納する処理と、
前記サーバが、前記音源の方位に対応する再生情報を前記話者感度情報格納部から取得して、前記受信した音声を前記取得した再生情報に基づいて変更する処理と、
前記サーバが、前記音声変更部で変更された音声を前記第2の拠点へ送信する処理と、を前記計算機及びサーバに機能させることを特徴とするプログラム。
101 計算機
102 A/DD/A変換装置
104 画像表示装置
105 マイクロホンアレイ
106 スピーカ
601 多chA/D変換部
602 多chフレーム処理部
603 多ch短時間周波数分析部
604 多ch音響エコーキャンセラ部
605 音声受信部
606 音声再生部
607 音声区間検出部
608 音源定位部
609 拠点毎感度変更部
610 拠点毎感度調整部
611 拠点毎時間信号生成部
612 遠端ユーザー操作受信部
613 遠端ユーザー操作歴
614 話者感度情報
615 マイク配置
616 音声送信部
Claims (11)
- 複数の拠点間で音声通信を行う音声通信装置であって、
音声を収集する集音素子を複数備えたマイクロホンアレイと、
前記複数の集音素子が収集した音声から音源の方位を特定する音源方位特定部と、
前記収集した音声を他の拠点へ送信する音声送信部と、
他の拠点からの音声を受信する音声受信部と、
前記受信した音声を再生する再生部と、
前記再生中の音声に対する再生情報を設定する再生情報設定部と、
前記再生情報を設定した音源の方位を前記音源方位特定部から取得して、当該音源の方位と再生情報を対応付けて格納する話者感度情報格納部と、
前記話者感度情報格納部から再生中の音声の音源の方位に対応する再生情報を取得し、当該再生情報に基づいて音声を変更する音声変更部と、を備え、
前記音声変更部は、
前記音源の方位が変化したときには、前記話者感度情報格納部から新たな音源の方位に対応する再生情報を取得し、当該再生情報に基づいて音声を変更することを特徴とする音声通信装置。 - 前記複数の拠点は、ネットワークで接続された第1の拠点と第2の拠点とを含み、
前記第2の拠点は、
前記第1の拠点から音声を受信する前記音声受信部と、
前記受信した音声を再生する前記再生部と、
前記再生中の音声に対する再生情報を設定する前記再生情報設定部と、
前記再生情報を前記第1の拠点へ送信する再生情報送信部と、を有し、
前記第1の拠点は、
前記マイクロホンアレイの前記複数の集音素子が収集した音声から第1の拠点における音源の方位を特定する前記音源方位特定部と、
前記第2の拠点から再生情報を受信する再生情報受信部と、
前記第2の拠点へ送信中の音源の方位を前記音源方位特定部から取得して、音源の方位と前記受信した再生情報を対応付けて格納する前記話者感度情報格納部と、
前記音源の方位に対応する再生情報を前記話者感度情報格納部から取得して、前記収集した音声を前記取得した再生情報に基づいて変更する前記音声変更部と、
前記音声変更部で変更された音声を前記第2の拠点へ送信する前記音声送信部と、
を有することを特徴とする請求項1に記載の音声通信装置。 - 前記複数の拠点は、ネットワークで接続された第1の拠点と第2の拠点とを含み、
前記第1の拠点は、
前記マイクロホンアレイの前記複数の集音素子が収集した音声から第1の拠点における音源の方位を特定する前記音源方位特定部と、
前記収集した音声と前記特定した音源の方位を第2の拠点へ送信する送信部と、を有し、
前記第2の拠点は、
前記第1の拠点から音声と音源の方位を受信する受信部と、
前記受信した音声を再生する前記再生部と、
前記再生中の音声に対する再生情報を設定する前記再生情報設定部と、
前記設定された再生情報と受信した音源の方位とを対応付けて格納する前記話者感度情報格納部と、
前記話者感度情報格納部から再生中の音声の音源の方位に対応する再生情報を取得し、当該再生情報に基づいて音声を変更する前記音声変更部と、
を有することを特徴とする請求項1に記載の音声通信装置。 - 前記複数の拠点は、ネットワークで接続された第1の拠点と第2の拠点及びサーバを含み、
前記第1の拠点は、
前記マイクロホンアレイの前記複数の集音素子が収集した音声から第1の拠点における音源の方位を特定する前記音源方位特定部と、
前記収集した音声と前記特定した音源の方位を前記サーバへ送信する送信部と、を有し、
前記第2の拠点は、
前記サーバから音声を受信する前記音声受信部と、
前記受信した音声を再生する前記再生部と、
前記再生中の音声に対する再生情報を設定する前記再生情報設定部と、
前記再生情報を前記サーバへ送信する再生情報送信部と、を有し、
前記サーバは、
前記第1の拠点から音声と音源の方位を受信する受信部と、
前記第2の拠点から再生情報を受信する再生情報受信部と、
前記第1の拠点から受信した音源の方位と前記第2の拠点から受信した再生情報を対応付けて格納する前記話者感度情報格納部と、
前記音源の方位に対応する再生情報を前記話者感度情報格納部から取得して、前記受信した音声を前記取得した再生情報に基づいて変更する前記音声変更部と、
前記音声変更部で変更された音声を前記第2の拠点へ送信する前記音声送信部と、を有することを特徴とする請求項1に記載の音声通信装置。 - 前記音源方位特定部は、
発話中の話者の方位を特定することを特徴とする請求項1に記載の音声通信装置。 - 前記再生情報は、
再生する音声の音量、話速またはピッチの少なくともひとつを含むことを特徴とする請求項1に記載の音声通信装置。 - 前記再生情報は、
再生する音声の音量を含み、
前記再生情報設定部は、
消音を含めて音量を変更し、
前記音声変更部は、
前記再生情報が消音の場合には、当該再生情報に対応する音源の方位で発話する話者の音声の再生を中止することを特徴とする請求項1に記載の音声通信装置。 - 前記話者感度情報格納部は、
前記音源の方位を話者の方位とし、当該話者毎に再生情報を対応付けて格納することを特徴とする請求項1に記載の音声通信装置。 - 前記再生情報設定部は、
前記再生情報の設定があったときに、再生中の音源の方位を話者の方位として表示装置に表示するユーザインターフェースを有することを特徴とする請求項1に記載の音声通信装置。 - 複数の拠点間で音声通信を行う音声通信方法であって、
音声を収集する集音素子を複数備えたマイクロホンアレイで音声を収集するステップと、
前記複数の集音素子が収集した音声から音源の方位を特定するステップと、
前記収集した音声を他の拠点へ送信するステップと、
前記音声送信部からの音声を受信するステップと、
前記受信した音声を再生するステップと、
前記再生中の音声に対する再生情報を設定するステップと、
前記再生情報を設定した音源の方位を取得して、当該音源の方位と再生情報を対応付けて話者感度情報格納部に格納するステップと、
前記話者感度情報格納部から再生中の音声の音源の方位に対応する再生情報を取得し、当該再生情報に基づいて音声を変更するステップと、を含み、
前記音源の方位が変化したときには、前記話者感度情報格納部から新たな音源の方位に対応する再生情報を取得し、当該再生情報に基づいて音声を変更することを特徴とする音声通信方法。 - 計算機をそれぞれ備えた複数の拠点間で音声通信を行うプログラムであって、
音声を収集する集音素子を複数備えたマイクロホンアレイで音声を収集する処理と、
前記複数の集音素子が収集した音声から音源の方位を特定する処理と、
前記収集した音声を他の拠点へ送信する処理と、
前記音声送信部からの音声を受信する処理と、
前記受信した音声を再生する処理と、
前記再生中の音声に対する再生情報を設定する処理と、
前記再生情報を設定した音源の方位を取得して、当該音源の方位と再生情報を対応付けて話者感度情報格納部に格納する処理と、
前記話者感度情報格納部から再生中の音声の音源の方位に対応する再生情報を取得し、当該再生情報に基づいて音声を変更する処理と、
を前記計算機に実行させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007182068A JP5134876B2 (ja) | 2007-07-11 | 2007-07-11 | 音声通信装置及び音声通信方法並びにプログラム |
US12/169,656 US8462190B2 (en) | 2007-07-11 | 2008-07-09 | Voice communication device, voice communication method, and voice communication program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007182068A JP5134876B2 (ja) | 2007-07-11 | 2007-07-11 | 音声通信装置及び音声通信方法並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009021764A true JP2009021764A (ja) | 2009-01-29 |
JP5134876B2 JP5134876B2 (ja) | 2013-01-30 |
Family
ID=40252750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007182068A Expired - Fee Related JP5134876B2 (ja) | 2007-07-11 | 2007-07-11 | 音声通信装置及び音声通信方法並びにプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8462190B2 (ja) |
JP (1) | JP5134876B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2213983A2 (en) | 2009-02-02 | 2010-08-04 | Sony Corporation | Navigation apparatus |
JP2011080868A (ja) * | 2009-10-07 | 2011-04-21 | Hitachi Ltd | 音響監視システム、及び音声集音システム |
JP2011215842A (ja) * | 2010-03-31 | 2011-10-27 | Sogo Keibi Hosho Co Ltd | 警備装置および警備方法 |
WO2012023268A1 (ja) * | 2010-08-16 | 2012-02-23 | 日本電気株式会社 | 多マイクロホン話者分類装置、方法およびプログラム |
JP2014199651A (ja) * | 2013-03-15 | 2014-10-23 | 株式会社リコー | 配信制御システム、配信システム、配信制御方法、及びプログラム |
US10091599B2 (en) | 2013-03-28 | 2018-10-02 | Samsung Electronics Co., Ltd. | Portable terminal, hearing aid, and method of indicating positions of sound sources in the portable terminal |
CN109213468A (zh) * | 2018-08-23 | 2019-01-15 | 阿里巴巴集团控股有限公司 | 一种语音播放方法和装置 |
US10836338B2 (en) | 2011-12-27 | 2020-11-17 | Robert Bosch Gmbh | Method and device for monitoring an energy reserve and safety device for a vehicle |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8274546B1 (en) * | 2008-03-12 | 2012-09-25 | Logitech Europe S.A. | System and method for improving audio capture quality in a living room type environment |
US8711199B2 (en) | 2009-01-13 | 2014-04-29 | At&T Intellectual Property I, L.P. | Method and apparatus for communications |
CN102809742B (zh) | 2011-06-01 | 2015-03-18 | 杜比实验室特许公司 | 声源定位设备和方法 |
WO2013046139A1 (en) * | 2011-09-28 | 2013-04-04 | Marvell World Trade Ltd. | Conference mixing using turbo-vad |
US9064497B2 (en) * | 2012-02-22 | 2015-06-23 | Htc Corporation | Method and apparatus for audio intelligibility enhancement and computing apparatus |
US9094570B2 (en) | 2012-04-30 | 2015-07-28 | Hewlett-Packard Development Company, L.P. | System and method for providing a two-way interactive 3D experience |
CN103390410A (zh) * | 2012-05-10 | 2013-11-13 | 宏碁股份有限公司 | 远程电话会议系统及方法 |
US10972521B2 (en) | 2012-10-18 | 2021-04-06 | NetTalk.com, Inc. | Method and apparatus for coviewing video |
US9148611B2 (en) * | 2012-10-18 | 2015-09-29 | Mettalk.Com, Inc. | Method and apparatus for coviewing video |
US9318121B2 (en) * | 2014-04-21 | 2016-04-19 | Sony Corporation | Method and system for processing audio data of video content |
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
US20170125010A1 (en) * | 2015-10-29 | 2017-05-04 | Yaniv Herman | Method and system for controlling voice entrance to user ears, by designated system of earphone controlled by Smartphone with reversed voice recognition control system |
US10142483B2 (en) * | 2015-12-22 | 2018-11-27 | Intel Corporation | Technologies for dynamic audio communication adjustment |
US10587978B2 (en) * | 2016-06-03 | 2020-03-10 | Nureva, Inc. | Method, apparatus and computer-readable media for virtual positioning of a remote participant in a sound space |
EP3465392B1 (en) | 2016-06-06 | 2021-02-17 | Nureva Inc. | Time-correlated touch and speech command input |
EP4243013A3 (en) | 2016-06-06 | 2023-11-08 | Nureva Inc. | Method, apparatus and computer-readable media for touch and speech interface with audio location |
JP7337699B2 (ja) * | 2017-03-23 | 2023-09-04 | ジョイソン セイフティ システムズ アクイジション エルエルシー | 口の画像を入力コマンドと相互に関連付けるシステム及び方法 |
US10558421B2 (en) * | 2017-05-22 | 2020-02-11 | International Business Machines Corporation | Context based identification of non-relevant verbal communications |
US10482904B1 (en) | 2017-08-15 | 2019-11-19 | Amazon Technologies, Inc. | Context driven device arbitration |
DE102018212902A1 (de) * | 2018-08-02 | 2020-02-06 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren zum Bestimmen eines digitalen Assistenten zum Ausführen einer Fahrzeugfunktion aus einer Vielzahl von digitalen Assistenten in einem Fahrzeug, computerlesbares Medium, System, und Fahrzeug |
US10861457B2 (en) * | 2018-10-26 | 2020-12-08 | Ford Global Technologies, Llc | Vehicle digital assistant authentication |
CN110196914B (zh) * | 2019-07-29 | 2019-12-27 | 上海肇观电子科技有限公司 | 一种将人脸信息录入数据库的方法和装置 |
KR20210112726A (ko) * | 2020-03-06 | 2021-09-15 | 엘지전자 주식회사 | 차량의 좌석별로 대화형 비서를 제공하는 방법 |
US11508380B2 (en) * | 2020-05-26 | 2022-11-22 | Apple Inc. | Personalized voices for text messaging |
KR20220059629A (ko) * | 2020-11-03 | 2022-05-10 | 현대자동차주식회사 | 차량 및 그의 제어방법 |
CN112700771A (zh) * | 2020-12-02 | 2021-04-23 | 珠海格力电器股份有限公司 | 空调、立体声控识别方法、计算机设备、存储介质及终端 |
EP4260013A2 (en) * | 2020-12-09 | 2023-10-18 | Cerence Operating Company | Automotive infotainment system with spatially-cognizant applications that interact with a speech interface |
US20220208185A1 (en) * | 2020-12-24 | 2022-06-30 | Cerence Operating Company | Speech Dialog System for Multiple Passengers in a Car |
US11659331B2 (en) | 2021-01-22 | 2023-05-23 | Toyota Motor Engineering & Manufacturing North America, Inc. | Systems and methods for audio balance adjustment |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11187130A (ja) * | 1997-12-22 | 1999-07-09 | Kyocera Corp | テレビ会議システム |
JP2005033811A (ja) * | 2003-07-11 | 2005-02-03 | Fuji Xerox Co Ltd | コミュニケーションシステム、会議を促進するシステム、及びコミュニケーション装置、並びに会議を実行するための方法 |
JP2005136701A (ja) * | 2003-10-30 | 2005-05-26 | Nippon Telegr & Teleph Corp <Ntt> | エコー・雑音抑制方法および多チャネル拡声通話システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3512828B2 (ja) | 1993-02-26 | 2004-03-31 | 松下電器産業株式会社 | テレビ会議システム |
US8934382B2 (en) * | 2001-05-10 | 2015-01-13 | Polycom, Inc. | Conference endpoint controlling functions of a remote device |
US6882971B2 (en) * | 2002-07-18 | 2005-04-19 | General Instrument Corporation | Method and apparatus for improving listener differentiation of talkers during a conference call |
US7843486B1 (en) * | 2006-04-10 | 2010-11-30 | Avaya Inc. | Selective muting for conference call participants |
-
2007
- 2007-07-11 JP JP2007182068A patent/JP5134876B2/ja not_active Expired - Fee Related
-
2008
- 2008-07-09 US US12/169,656 patent/US8462190B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11187130A (ja) * | 1997-12-22 | 1999-07-09 | Kyocera Corp | テレビ会議システム |
JP2005033811A (ja) * | 2003-07-11 | 2005-02-03 | Fuji Xerox Co Ltd | コミュニケーションシステム、会議を促進するシステム、及びコミュニケーション装置、並びに会議を実行するための方法 |
JP2005136701A (ja) * | 2003-10-30 | 2005-05-26 | Nippon Telegr & Teleph Corp <Ntt> | エコー・雑音抑制方法および多チャネル拡声通話システム |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2213983A2 (en) | 2009-02-02 | 2010-08-04 | Sony Corporation | Navigation apparatus |
JP2011080868A (ja) * | 2009-10-07 | 2011-04-21 | Hitachi Ltd | 音響監視システム、及び音声集音システム |
JP2011215842A (ja) * | 2010-03-31 | 2011-10-27 | Sogo Keibi Hosho Co Ltd | 警備装置および警備方法 |
WO2012023268A1 (ja) * | 2010-08-16 | 2012-02-23 | 日本電気株式会社 | 多マイクロホン話者分類装置、方法およびプログラム |
US10836338B2 (en) | 2011-12-27 | 2020-11-17 | Robert Bosch Gmbh | Method and device for monitoring an energy reserve and safety device for a vehicle |
JP2014199651A (ja) * | 2013-03-15 | 2014-10-23 | 株式会社リコー | 配信制御システム、配信システム、配信制御方法、及びプログラム |
US10091599B2 (en) | 2013-03-28 | 2018-10-02 | Samsung Electronics Co., Ltd. | Portable terminal, hearing aid, and method of indicating positions of sound sources in the portable terminal |
US10869146B2 (en) | 2013-03-28 | 2020-12-15 | Samsung Electronics Co., Ltd. | Portable terminal, hearing aid, and method of indicating positions of sound sources in the portable terminal |
CN109213468A (zh) * | 2018-08-23 | 2019-01-15 | 阿里巴巴集团控股有限公司 | 一种语音播放方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US20090015651A1 (en) | 2009-01-15 |
JP5134876B2 (ja) | 2013-01-30 |
US8462190B2 (en) | 2013-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5134876B2 (ja) | 音声通信装置及び音声通信方法並びにプログラム | |
US11527243B1 (en) | Signal processing based on audio context | |
US10251009B2 (en) | Audio scene apparatus | |
US20230395088A1 (en) | Robust Short-Time Fourier Transform Acoustic Echo Cancellation During Audio Playback | |
US20200184991A1 (en) | Sound class identification using a neural network | |
JP5231139B2 (ja) | 音源抽出装置 | |
JP2016146547A (ja) | 収音システム及び収音方法 | |
JPWO2010113438A1 (ja) | 音声認識処理システム、および音声認識処理方法 | |
EP2826261B1 (en) | Spatial audio signal filtering | |
JPWO2018100743A1 (ja) | 制御装置および機器制御システム | |
JP5034607B2 (ja) | 音響エコーキャンセラシステム | |
WO2022253003A1 (zh) | 语音增强方法及相关设备 | |
CN115482830A (zh) | 语音增强方法及相关设备 | |
JP6201279B2 (ja) | サーバ、サーバの制御方法および制御プログラム、情報処理システム、情報処理方法、携帯端末、携帯端末の制御方法および制御プログラム | |
CN107452398B (zh) | 回声获取方法、电子设备及计算机可读存储介质 | |
JP2019184809A (ja) | 音声認識装置、音声認識方法 | |
US11227423B2 (en) | Image and sound pickup device, sound pickup control system, method of controlling image and sound pickup device, and method of controlling sound pickup control system | |
US7043427B1 (en) | Apparatus and method for speech recognition | |
WO2019207912A1 (ja) | 情報処理装置及び情報処理方法 | |
US11735187B2 (en) | Hybrid routing for hands-free voice assistant, and related systems and methods | |
JP5143656B2 (ja) | 音収集システム及び音表示方法 | |
JP4507905B2 (ja) | 音声会議用の通信制御装置,通信制御方法,プログラム及び記録媒体 | |
JP2005157086A (ja) | 音声認識装置 | |
Mischie et al. | On using respeaker mic array 2.0 for speech processing algorithms | |
JP2007086592A (ja) | 音声出力装置および音声出力方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120306 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120309 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121023 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121112 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151116 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5134876 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |