JP2015222847A - 音声処理装置、音声処理方法および音声処理プログラム - Google Patents
音声処理装置、音声処理方法および音声処理プログラム Download PDFInfo
- Publication number
- JP2015222847A JP2015222847A JP2014105825A JP2014105825A JP2015222847A JP 2015222847 A JP2015222847 A JP 2015222847A JP 2014105825 A JP2014105825 A JP 2014105825A JP 2014105825 A JP2014105825 A JP 2014105825A JP 2015222847 A JP2015222847 A JP 2015222847A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- user
- phase difference
- sound
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000003672 processing method Methods 0.000 title claims description 12
- 238000004364 calculation method Methods 0.000 claims abstract description 79
- 230000005540 biological transmission Effects 0.000 claims abstract description 37
- 238000004891 communication Methods 0.000 claims abstract description 11
- 238000000034 method Methods 0.000 description 34
- 238000010586 diagram Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 19
- 230000003287 optical effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/0308—Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】音声処理装置1は、第2ユーザよりも第1ユーザに近接する第1マイク9に入力される、第1ユーザの第1音声と第2ユーザの第2音声と、第1ユーザよりも第2ユーザに近接する第2マイク11に入力される、第1ユーザの第3音声と第2ユーザの第4音声と、を含む複数音声を、通信網117を介して受信する受信部2を備える。更に、受信部が受信する、第1音声と第2音声の第1位相差、ならびに第3音声と第4音声の第2位相差を算出する算出部3を備える。更に、第2ユーザよりも第1ユーザに近接する第1スピーカ10に対する、第2音声または第4音声の送信を、第1位相差と第2位相差に基づいて制御、または、第1ユーザよりも第2ユーザに近接する第2スピーカに対する、第1音声または第3音声の送信を、第1位相差と第2位相差に基づいて制御する制御部5を備える。
【選択図】図1
Description
図1は、一つの実施形態による音声処理装置1の機能ブロック図を含むハードウェア構成図である。音声処理装置1は、受信部2、算出部3、推定部4、制御部5を有する。音声処理装置1は、通信網の一例となる有線回路または無線回路のネットワーク117を介して、複数の端末(例えば、PCやソフトウェアアプリケーションがインストール可能な高機能携帯端末)が接続される。例えば、第1端末6には、第1マイク9と第1スピーカ10が接続され、当該第1マイク9と第1スピーカ10は、第1ユーザに近接した状態で配置される。また、第2端末7には、第2マイク11と第2スピーカ12が接続され、当該第2マイク11と第2スピーカ12は、第2ユーザに近接した状態で配置される。更に、第n端末8には、第nマイク13と第nスピーカ14が接続され、当該第nマイク13と第nスピーカ14は、第nユーザに近接した状態で配置される。図2は、音声処理装置1の音声処理の第1のフローチャートである。実施例1においては、図2に示す音声処理装置1による音声処理のフローを、図1に示す音声処理装置1の機能ブロック図の各機能の説明に対応付けて説明する。
(数1)
但し、上述の(数1)において、nは、入力音声に含まれる音響フレームの入力開始から各フレームに連続して付されるフレーム番号(nは0以上の整数)、Mは1フレームの時間長、tは時間、c(t)は、入力音声の振幅(電力)を示す。
雑音推定部21は、フレームnにおける雑音の大きさ(電力)N(n)を、フレームnにおける音量S(n)、前フレーム(n−1)における音量S(n−1)ならびに、雑音の大きさN(n−1)に基づいて、次式を用いて推定することが出来る。
(数2)
但し、上述の(数2)において、α、βは、定数であり、実験的に決定されれば良い。例えば、α=0.9、β=2.0であれば良い。また、雑音電力の初期値N(−1)も、実験的に決定されれば良い。上述の(数2)において、フレームnの音量S(n)が、1つ前のフレームn−1の音量S(n−1)に対して一定値β以上変化しない場合には、フレームnの雑音電力N(n)が更新される。一方、フレームnの音量S(n)が、1つ前のフレームn−1の音量S(n−1)に対して一定値β以上変化する場合には、1つ前のフレームn−1の雑音電力N(n−1)をフレームnの雑音電力N(n)とする。なお、雑音電力N(n)を上述の雑音推定結果と称しても良い。
雑音推定部21は、雑音の大きさの更新を、次式の(数3)を用いて、フレームnの音量S(n)と、1つ前のフレームn−1の雑音電力N(n−1)との比に基づいて実施しても良い。
(数3)
但し、上述の(数3)において、γは定数であり、実験的に決定されれば良い。例えば、γ=2.0であれば良い。また、雑音電力の初期値N(−1)も、実験的に決定されれば良い。上述の(数3)において、フレームnの音量S(n)が、1つ前のフレームn−1の雑音電力N(n−1)に対して一定値γ倍以下である場合には、フレームnの雑音電力N(n)を更新する。一方、フレームnの音量S(n)が、1つ前のフレームn−1の雑音電力N(n−1)に対して一定値γ倍以上である場合には、1つ前のフレームn−1の雑音電力N(n−1)をフレームnの雑音電力N(n)とする。
(数4)
但し、上述の(数4)において、Lは促音の一般的な長さよりも大きな値に規定すれば良く、例えば、0.5msecに相当するフレーム数を規定すれば良い。
(数5)
tb=n×M
(if n_breath=有音区間ではない、かつ、SNR(n)>THSNR)
(数6)
te=n×M−1
(if n_breath=有音区間、かつ、SNR(n)<THSNR)
ここで、THSNRは、区間決定部23による処理フレームnが雑音ではないと看做すための閾値であり、実験的に規定されれば良い。また、区間決定部23は、入力音声において有音区間以外の区間を無音区間として検出することが出来る。
(数7)
なお、上述の(数7)において、tbiは有音区間ci(t)の始点であり、teiは有音区間ci(t)の終点である。tbjは有音区間cj(t)の始点であり、tejは、有音区間cj(t)の終点である。また、m=tbj−tbi、L=tbe−tbiである。
(数8)
判定結果 = 同一発話 if ( max(R(d))> MAX_R)
= 同一発話ではない else
なお、上述の(数8)において、有音区間長の差|(tei−tbi)−(tej−tbj)|が任意の閾値TH_dL(例えば、TH_dL=1秒)よりも大きくなる場合は、異なる発話内容として予め判定対象から除外しても良い。実施例1においては、第1音声と第3音声の候補の同定方法について説明したが、第2音声と第4音声の候補の同定方法も第1音声と第3音声の候補の同定方法を同様に適用することが出来る。算出部3は、第1マイク9に入力された入力音声と、第2マイク11に入力された入力音声から同一の発話内容となる、例えば、第2音声と第4音声の候補を、第2音声と第4音声の第2相関R2(d)に基づいて同定する。第2相関R2(d)は、上述の(数7)の右辺をそのまま適用することが出来る。
(数9)
dm=(第1位相差+第2位相差)/2×vs
但し、上述の(数9)において、vsは音速である。また、推定部4は、推定距離の推定に代えて、第1位相差と第2位相差の比較として、第1位相差と第2位相差の合計値を算出しても良い。推定部4は、第1マイク9と第2マイク11の推定距離または、第1位相差と第2位相差の合計値を制御部5に出力する。
実施例1においては、第1ユーザと第2ユーザを対象とした音声処理について説明したが、本発明は、複数のユーザで通話を行う場合においても、当該複数のユーザ同士の距離を正確に推定することが可能である。この為、実施例2においては、図1の第1ユーザに対応する第1端末6ないし第nユーザに対応する第n端末8までを対象にした音声処理について説明する。
(数10)
上述の(数10)において、ci(t)は第i端末からの入力音声iであり、viは入力音声iの音声レベルであり、tbiとteiは、入力音声iにおける有音区間の開始フレーム(始点と称しても良い)と終了フレーム(終点と称しても良い)である。次に、算出部3は、上述の(数10)で算出された複数の音声レベルviの値を比較し、最も大きな値を有する入力音声iを、発話の発信源の端末番号であると推定する。実施例2においては、説明の便宜上、発信源と推定した端末番号がn(第n端末8)であるものとして以下の説明を続ける。
(数11)
θ(n,km) = tbn − tbkm
(数12)
θ’(n,km) =(θ(n,km)+θ(km,n))/2
θ’(km,n) =(θ(n,km)+θ(km,n))/2
上述の(数12)において、θ(km,n)は、発信源と推定した端末番号がkmであり、ckm(t)の有音区間が、cn(t)の有音区間と同一の発話であった場合に、次式により算出される値である。
(数13)
θ(km,n) = tbkm−tbn
なお、テーブル92の初期値は、端末間(マイク間)の距離が十分離れていることを示す任意の閾値TH_OFF以上の値に設定しておけば良い。なお、TH_OFFの値は、例えば約10mの距離により生じる位相差の30msであれば良い。もしくは、設定可能な値以上を表すinfでも良い。
出力音声on(t)を更新する(ステップS1005)。
(数14)
on(t) = on(t) + ck(t)
図11は、一つの実施形態による音声処理装置1として機能するコンピュータのハードウェア構成図である。図11に示す通り、音声処理装置1は、コンピュータ100、およびコンピュータ100に接続する入出力装置(周辺機器)を含んで構成される。
(付記1)
第2ユーザよりも第1ユーザに近接する第1マイクに入力される、前記第1ユーザの第1音声と前記第2ユーザの第2音声と、
前記第1ユーザよりも前記第2ユーザに近接する第2マイクに入力される、前記第1ユーザの第3音声と前記第2ユーザの第4音声と、
を含む複数音声を、通信網を介して受信する受信部と、
前記受信部が受信する、前記第1音声と前記第2音声の第1位相差、ならびに前記第3音声と前記第4音声の第2位相差を算出する算出部と、
前記第2ユーザよりも前記第1ユーザに近接する第1スピーカに対する、前記第2音声または前記第4音声の送信を、前記第1位相差と前記第2位相差に基づいて制御、または、
前記第1ユーザよりも前記第2ユーザに近接する第2スピーカに対する、前記第1音声または前記第3音声の送信を、前記第1位相差と前記第2位相差に基づいて制御する制御部
を備えることを特徴とする音声処理装置。
(付記2)
前記算出部は、
前記第1音声を基準として前記第1位相差を算出し、前記第4音声を基準として前記第2位相差を算出し、または、
前記第3音声を基準として前記第1位相差を算出し、前記第2音声を基準として前記第2位相差を算出する
ことを特徴とする付記1記載の音声処理装置。
(付記3)
前記算出部は、前記複数音声の中から、
前記第1音声と前記第3音声の第1相関に基づいて、前記第1音声と前記第3音声を同定し、
前記第2音声と前記第4音声の第2相関に基づいて、前記第2音声と前記第4音声を同定することを特徴とする付記1または付記2記載の音声処理装置。
(付記4)
前記算出部は、
前記第1音声と前記第3音声の振幅に基づいて、前記第1音声と前記第2音声を区別し、
前記第2音声と前記第4音声の前記振幅に基づいて、前記第3音声と前記第4音声を区別することを特徴とする付記1ないし付記3の何れか一つに記載の音声処理装置。
(付記5)
前記第1位相差と前記第2位相差に基づいて、前記第1マイクと前記第2マイクの距離を推定する推定部を更に備えることを特徴とする付記1ないし付記4の何れか一つに記載の音声処理装置。
(付記6)
前記推定部は、前記第1位相差と前記第2位相差の合計値に基づいて前記距離を推定することを特徴とする付記5に記載の音声処理装置。
(付記7)
前記制御部は、前記距離が第1閾値未満の場合に、
前記第1スピーカに対する、前記第2音声または前記第4音声の送信を制御し、
前記第2スピーカに対する、前記第1音声または前記第3音声の送信を制御することを特徴とする付記5または付記6に記載の音声処理装置。
(付記8)
前記制御部は、前記距離が前記第1閾値以上の場合に、
前記第1スピーカに対する、前記第1音声または前記第3音声以外の前記複数音声の送信を制御し、
前記第2スピーカに対する、前記第2音声または前記第4音声以外の前記複数音声の前記送信を制御することを特徴とする付記5ないし付記7の何れか一つに記載の音声処理装置。
(付記9)
第2ユーザよりも第1ユーザに近接する第1マイクに入力される、前記第1ユーザの第1音声と前記第2ユーザの第2音声と、
前記第1ユーザよりも前記第2ユーザに近接する第2マイクに入力される、前記第1ユーザの第3音声と前記第2ユーザの第4音声と、
を含む複数音声を、通信網を介して受信し、
前記受信することが受信する、前記第1音声と前記第2音声の第1位相差、ならびに前記第3音声と前記第4音声の第2位相差を算出し、
前記第2ユーザよりも前記第1ユーザに近接する第1スピーカに対する、前記第2音声または前記第4音声の送信を、前記第1位相差と前記第2位相差に基づいて制御、または、
前記第1ユーザよりも前記第2ユーザに近接する第2スピーカに対する、前記第1音声または前記第3音声の送信を、前記第1位相差と前記第2位相差に基づいて制御する
ことを含むことを特徴とする音声処理方法。
(付記10)
前記算出することは、
前記第1音声を基準として前記第1位相差を算出し、前記第4音声を基準として前記第2位相差を算出し、または、
前記第3音声を基準として前記第1位相差を算出し、前記第2音声を基準として前記第2位相差を算出する
ことを特徴とする付記9記載の音声処理方法。
(付記11)
前記算出することは、前記複数音声の中から、
前記第1音声と前記第3音声の第1相関に基づいて、前記第1音声と前記第3音声を同定し、
前記第2音声と前記第4音声の第2相関に基づいて、前記第2音声と前記第4音声を同定することを特徴とする付記9または付記10記載の音声処理方法。
(付記12)
前記算出することは、
前記第1音声と前記第3音声の振幅に基づいて、前記第1音声と前記第2音声を区別し、
前記第2音声と前記第4音声の前記振幅に基づいて、前記第3音声と前記第4音声を区別することを特徴とする付記9ないし付記11の何れか一つに記載の音声処理方法。
(付記13)
前記第1位相差と前記第2位相差に基づいて、前記第1マイクと前記第2マイクの距離を推定することを更に含むことを特徴とする付記9ないし付記12の何れか一つに記載の音声処理方法。
(付記14)
前記推定することは、前記第1位相差と前記第2位相差の合計値に基づいて前記距離を推定することを特徴とする付記13に記載の音声処理方法。
(付記15)
前記制御することは、前記距離が第1閾値未満の場合に、
前記第1スピーカに対する、前記第2音声または前記第4音声の送信を制御し、
前記第2スピーカに対する、前記第1音声または前記第3音声の送信を制御することを特徴とする付記13または付記14に記載の音声処理方法。
(付記16)
前記制御することは、前記距離が前記第1閾値以上の場合に、
前記第1スピーカに対する、前記第1音声または前記第3音声以外の前記複数音声の送信を制御し、
前記第2スピーカに対する、前記第2音声または前記第4音声以外の前記複数音声の前記送信を制御することを特徴とする付記13ないし付記15の何れか一つに記載の音声処理方法。
(付記17)
コンピュータに、
第2ユーザよりも第1ユーザに近接する第1マイクに入力される、前記第1ユーザの第1音声と前記第2ユーザの第2音声と、
前記第1ユーザよりも前記第2ユーザに近接する第2マイクに入力される、前記第1ユーザの第3音声と前記第2ユーザの第4音声と、
を含む複数音声を、通信網を介して受信し、
前記受信することが受信する、前記第1音声と前記第2音声の第1位相差、ならびに前記第3音声と前記第4音声の第2位相差を算出し、
前記第2ユーザよりも前記第1ユーザに近接する第1スピーカに対する、前記第2音声または前記第4音声の送信を、前記第1位相差と前記第2位相差に基づいて制御、または、
前記第1ユーザよりも前記第2ユーザに近接する第2スピーカに対する、前記第1音声または前記第3音声の送信を、前記第1位相差と前記第2位相差に基づいて制御する
ことを実行させることを特徴とする音声処理プログラム。
2 受信部
3 算出部
4 推定部
5 制御部
Claims (10)
- 第2ユーザよりも第1ユーザに近接する第1マイクに入力される、前記第1ユーザの第1音声と前記第2ユーザの第2音声と、
前記第1ユーザよりも前記第2ユーザに近接する第2マイクに入力される、前記第1ユーザの第3音声と前記第2ユーザの第4音声と、
を含む複数音声を、通信網を介して受信する受信部と、
前記受信部が受信する、前記第1音声と前記第2音声の第1位相差、ならびに前記第3音声と前記第4音声の第2位相差を算出する算出部と、
前記第2ユーザよりも前記第1ユーザに近接する第1スピーカに対する、前記第2音声または前記第4音声の送信を、前記第1位相差と前記第2位相差に基づいて制御、または、
前記第1ユーザよりも前記第2ユーザに近接する第2スピーカに対する、前記第1音声または前記第3音声の送信を、前記第1位相差と前記第2位相差に基づいて制御する制御部
を備えることを特徴とする音声処理装置。 - 前記算出部は、
前記第1音声を基準として前記第1位相差を算出し、前記第4音声を基準として前記第2位相差を算出し、または、
前記第3音声を基準として前記第1位相差を算出し、前記第2音声を基準として前記第2位相差を算出する
ことを特徴とする請求項1記載の音声処理装置。 - 前記算出部は、前記複数音声の中から、
前記第1音声と前記第3音声の第1相関に基づいて、前記第1音声と前記第3音声を同定し、
前記第2音声と前記第4音声の第2相関に基づいて、前記第2音声と前記第4音声を同定することを特徴とする請求項1または請求項2記載の音声処理装置。 - 前記算出部は、
前記第1音声と前記第3音声の振幅に基づいて、前記第1音声と前記第2音声を区別し、
前記第2音声と前記第4音声の前記振幅に基づいて、前記第3音声と前記第4音声を区別することを特徴とする請求項1ないし請求項3の何れか一項に記載の音声処理装置。 - 前記第1位相差と前記第2位相差に基づいて、前記第1マイクと前記第2マイクの距離を推定する推定部を更に備えることを特徴とする請求項1ないし請求項4の何れか一項に記載の音声処理装置。
- 前記推定部は、前記第1位相差と前記第2位相差の合計値に基づいて前記距離を推定することを特徴とする請求項5に記載の音声処理装置。
- 前記制御部は、前記距離が第1閾値未満の場合に、
前記第1スピーカに対する、前記第2音声または前記第4音声の送信を制御し、
前記第2スピーカに対する、前記第1音声または前記第3音声の送信を制御することを特徴とする請求項5または請求項6に記載の音声処理装置。 - 前記制御部は、前記距離が前記第1閾値以上の場合に、
前記第1スピーカに対する、前記第1音声または前記第3音声以外の前記複数音声の送信を制御し、
前記第2スピーカに対する、前記第2音声または前記第4音声以外の前記複数音声の前記送信を制御することを特徴とする請求項5ないし請求項7の何れか一項に記載の音声処理装置。 - 第2ユーザよりも第1ユーザに近接する第1マイクに入力される、前記第1ユーザの第1音声と前記第2ユーザの第2音声と、
前記第1ユーザよりも前記第2ユーザに近接する第2マイクに入力される、前記第1ユーザの第3音声と前記第2ユーザの第4音声と、
を含む複数音声を、通信網を介して受信し、
前記受信することが受信する、前記第1音声と前記第2音声の第1位相差、ならびに前記第3音声と前記第4音声の第2位相差を算出し、
前記第2ユーザよりも前記第1ユーザに近接する第1スピーカに対する、前記第2音声または前記第4音声の送信を、前記第1位相差と前記第2位相差に基づいて制御、または、
前記第1ユーザよりも前記第2ユーザに近接する第2スピーカに対する、前記第1音声または前記第3音声の送信を、前記第1位相差と前記第2位相差に基づいて制御する
ことを含むことを特徴とする音声処理方法。 - コンピュータに、
第2ユーザよりも第1ユーザに近接する第1マイクに入力される、前記第1ユーザの第1音声と前記第2ユーザの第2音声と、
前記第1ユーザよりも前記第2ユーザに近接する第2マイクに入力される、前記第1ユーザの第3音声と前記第2ユーザの第4音声と、
を含む複数音声を、通信網を介して受信し、
前記受信することが受信する、前記第1音声と前記第2音声の第1位相差、ならびに前記第3音声と前記第4音声の第2位相差を算出し、
前記第2ユーザよりも前記第1ユーザに近接する第1スピーカに対する、前記第2音声または前記第4音声の送信を、前記第1位相差と前記第2位相差に基づいて制御、または、
前記第1ユーザよりも前記第2ユーザに近接する第2スピーカに対する、前記第1音声または前記第3音声の送信を、前記第1位相差と前記第2位相差に基づいて制御する
ことを実行させることを特徴とする音声処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014105825A JP2015222847A (ja) | 2014-05-22 | 2014-05-22 | 音声処理装置、音声処理方法および音声処理プログラム |
US14/711,284 US20150340048A1 (en) | 2014-05-22 | 2015-05-13 | Voice processing device and voice processsing method |
EP15168123.6A EP2947659A1 (en) | 2014-05-22 | 2015-05-19 | Voice processing device and voice processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014105825A JP2015222847A (ja) | 2014-05-22 | 2014-05-22 | 音声処理装置、音声処理方法および音声処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015222847A true JP2015222847A (ja) | 2015-12-10 |
Family
ID=53189701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014105825A Ceased JP2015222847A (ja) | 2014-05-22 | 2014-05-22 | 音声処理装置、音声処理方法および音声処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20150340048A1 (ja) |
EP (1) | EP2947659A1 (ja) |
JP (1) | JP2015222847A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108630223A (zh) * | 2017-03-21 | 2018-10-09 | 株式会社东芝 | 信号处理装置以及信号处理方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
JP6641832B2 (ja) * | 2015-09-24 | 2020-02-05 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
US10142730B1 (en) * | 2017-09-25 | 2018-11-27 | Cirrus Logic, Inc. | Temporal and spatial detection of acoustic sources |
WO2021226503A1 (en) | 2020-05-08 | 2021-11-11 | Nuance Communications, Inc. | System and method for data augmentation for multi-microphone signal processing |
US11545024B1 (en) | 2020-09-24 | 2023-01-03 | Amazon Technologies, Inc. | Detection and alerting based on room occupancy |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06350724A (ja) * | 1993-06-08 | 1994-12-22 | Mitsubishi Electric Corp | 通信制御装置 |
US6771779B1 (en) * | 2000-09-28 | 2004-08-03 | Telefonaktiebolaget Lm Ericsson (Publ) | System, apparatus, and method for improving speech quality in multi-party devices |
JP2006066988A (ja) * | 2004-08-24 | 2006-03-09 | Nippon Telegr & Teleph Corp <Ntt> | 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体 |
JP2007243724A (ja) * | 2006-03-09 | 2007-09-20 | Omron Corp | 復調方法とその装置とそのユニット、距離測定装置、およびデータ受信装置 |
US20120170760A1 (en) * | 2009-06-08 | 2012-07-05 | Nokia Corporation | Audio Processing |
GB2493801A (en) * | 2011-08-18 | 2013-02-20 | Ibm | Improved audio quality in teleconferencing system with co-located devices |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004005998B3 (de) * | 2004-02-06 | 2005-05-25 | Ruwisch, Dietmar, Dr. | Verfahren und Vorrichtung zur Separierung von Schallsignalen |
US20050180582A1 (en) * | 2004-02-17 | 2005-08-18 | Guedalia Isaac D. | A System and Method for Utilizing Disjoint Audio Devices |
US8126129B1 (en) * | 2007-02-01 | 2012-02-28 | Sprint Spectrum L.P. | Adaptive audio conferencing based on participant location |
JP5381982B2 (ja) | 2008-05-28 | 2014-01-08 | 日本電気株式会社 | 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体 |
DE102010001935A1 (de) * | 2010-02-15 | 2012-01-26 | Dietmar Ruwisch | Verfahren und Vorrichtung zum phasenabhängigen Verarbeiten von Schallsignalen |
US8818800B2 (en) * | 2011-07-29 | 2014-08-26 | 2236008 Ontario Inc. | Off-axis audio suppressions in an automobile cabin |
JP5862349B2 (ja) * | 2012-02-16 | 2016-02-16 | 株式会社Jvcケンウッド | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
EP3024542A4 (en) * | 2013-07-24 | 2017-03-22 | Med-El Elektromedizinische Geräte GmbH | Binaural cochlear implant processing |
-
2014
- 2014-05-22 JP JP2014105825A patent/JP2015222847A/ja not_active Ceased
-
2015
- 2015-05-13 US US14/711,284 patent/US20150340048A1/en not_active Abandoned
- 2015-05-19 EP EP15168123.6A patent/EP2947659A1/en not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06350724A (ja) * | 1993-06-08 | 1994-12-22 | Mitsubishi Electric Corp | 通信制御装置 |
US6771779B1 (en) * | 2000-09-28 | 2004-08-03 | Telefonaktiebolaget Lm Ericsson (Publ) | System, apparatus, and method for improving speech quality in multi-party devices |
JP2006066988A (ja) * | 2004-08-24 | 2006-03-09 | Nippon Telegr & Teleph Corp <Ntt> | 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体 |
JP2007243724A (ja) * | 2006-03-09 | 2007-09-20 | Omron Corp | 復調方法とその装置とそのユニット、距離測定装置、およびデータ受信装置 |
US20120170760A1 (en) * | 2009-06-08 | 2012-07-05 | Nokia Corporation | Audio Processing |
GB2493801A (en) * | 2011-08-18 | 2013-02-20 | Ibm | Improved audio quality in teleconferencing system with co-located devices |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108630223A (zh) * | 2017-03-21 | 2018-10-09 | 株式会社东芝 | 信号处理装置以及信号处理方法 |
CN108630223B (zh) * | 2017-03-21 | 2022-01-04 | 株式会社东芝 | 信号处理装置以及信号处理方法 |
Also Published As
Publication number | Publication date |
---|---|
US20150340048A1 (en) | 2015-11-26 |
EP2947659A1 (en) | 2015-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2015222847A (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
US10269374B2 (en) | Rating speech effectiveness based on speaking mode | |
US9407680B2 (en) | Quality-of-experience measurement for voice services | |
US8909534B1 (en) | Speech recognition training | |
US9293133B2 (en) | Improving voice communication over a network | |
JP6078964B2 (ja) | 音声対話システム及びプログラム | |
CN110473525B (zh) | 获取语音训练样本的方法和装置 | |
JP2017535809A (ja) | サウンド検出モデルを生成するためのサウンドサンプル検証 | |
US8620670B2 (en) | Automatic realtime speech impairment correction | |
JP2013011830A (ja) | 異常状態検出装置、電話機、異常状態検出方法、及びプログラム | |
JP6641832B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP6098149B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP6524674B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP2017049364A (ja) | 発話状態判定装置、発話状態判定方法、及び判定プログラム | |
US11641592B1 (en) | Device management using stored network metrics | |
JP2017216525A (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
JP6394103B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP2019219468A (ja) | 生成装置、生成方法及び生成プログラム | |
US20230125307A1 (en) | Video conference verbal junction identification via nlp | |
JP6544439B2 (ja) | 困惑状態判定装置、困惑状態判定方法、及びプログラム | |
US20240112691A1 (en) | Synthesizing audio for synchronous communication | |
CN113436644B (zh) | 音质评估方法、装置、电子设备及存储介质 | |
US20240257811A1 (en) | System and Method for Providing Real-time Speech Recommendations During Verbal Communication | |
JP6538002B2 (ja) | 目的音集音装置、目的音集音方法、プログラム、記録媒体 | |
WO2024163127A1 (en) | System and method for providing real-time speech recommendations during verbal communication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20160401 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180320 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20180528 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180821 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20181218 |