JP2014174393A - 音声信号処理装置及び方法 - Google Patents
音声信号処理装置及び方法 Download PDFInfo
- Publication number
- JP2014174393A JP2014174393A JP2013048084A JP2013048084A JP2014174393A JP 2014174393 A JP2014174393 A JP 2014174393A JP 2013048084 A JP2013048084 A JP 2013048084A JP 2013048084 A JP2013048084 A JP 2013048084A JP 2014174393 A JP2014174393 A JP 2014174393A
- Authority
- JP
- Japan
- Prior art keywords
- channel signal
- signal
- sampling frequency
- signal processing
- mismatch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 166
- 238000012545 processing Methods 0.000 title claims abstract description 111
- 238000005070 sampling Methods 0.000 claims abstract description 213
- 230000037433 frameshift Effects 0.000 claims abstract description 18
- 230000005236 sound signal Effects 0.000 claims description 77
- 238000003672 processing method Methods 0.000 claims description 37
- 230000001360 synchronised effect Effects 0.000 claims description 21
- 238000007476 Maximum Likelihood Methods 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 18
- 230000009466 transformation Effects 0.000 abstract description 3
- 108091006146 Channels Proteins 0.000 description 222
- 230000006870 function Effects 0.000 description 43
- 238000010586 diagram Methods 0.000 description 27
- 238000000926 separation method Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 20
- 238000012937 correction Methods 0.000 description 13
- 230000015654 memory Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 6
- 230000010363 phase shift Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 102200048773 rs2224391 Human genes 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 238000005314 correlation function Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】対象チャンネル信号と参照チャンネル信号との間に録音開始時刻差があり、各録音機器のA/D変換器との間のサンプリング周波数のミスマッチがあるときに、対象チャンネル信号を参照チャンネル信号に同期させる音声信号処理装置において、参照チャンネル信号に対して一定のフレームシフトを行うことにより、短時間フーリエ変換表現の参照チャンネル信号を求める一方、録音開始時刻差とサンプリング周波数のミスマッチとに基づいて互いのフレーム中心が互いに対応するように、対象チャンネル信号に対して整数サンプルシフトと周波数領域での位相補償法による小数サンプルシフトを行うことにより短時間フーリエ変換表現の対象チャンネル信号を求める。
【選択図】図21
Description
上記参照チャンネル信号に対して一定のフレームシフトを行うことにより、短時間フーリエ変換表現の参照チャンネル信号を求める一方、上記録音開始時刻差と上記サンプリング周波数のミスマッチとに基づいて、上記参照チャンネル信号と上記対象チャンネル信号の互いのフレーム中心が互いに対応するように、上記対象チャンネル信号に対して整数サンプルシフトと周波数領域での位相補償法による小数サンプルシフトを行うことにより短時間フーリエ変換表現の対象チャンネル信号を求める第1の信号処理手段を備えたことを特徴とする。
上記参照チャンネル信号に対して一定のフレームシフトを行うことにより、短時間フーリエ変換表現の参照チャンネル信号を求める一方、上記録音開始時刻差と上記サンプリング周波数のミスマッチとに基づいて、上記参照チャンネル信号と上記対象チャンネル信号の互いのフレーム中心が互いに対応するように、上記対象チャンネル信号に対して整数サンプルシフトと周波数領域での位相補償法による小数サンプルシフトを行うことにより短時間フーリエ変換表現の対象チャンネル信号を求める第1の信号処理ステップを備えたことを特徴とする。
本発明に係る第1の実施形態では、非同期マイクロホンアレーのためのチャンネル間のサンプリング周波数のミスマッチをブラインドに推定し補償する手法について述べる。サンプリング周波数のミスマッチによるチャンネル間の時間差の変化は短時間では一定となるため、フレーム毎に周波数領域で位相を操作することで補償する。また、音源が移動しないと仮定した最尤推定により、サンプリング周波数のミスマッチを推定する。後述するように、実験により提案手法はアレー信号処理の性能を大幅に回復できることが確認された。
(1)各A/D変換器のサンプリング周波数がずれているために、波形の伸縮が発生する。
(2)録音開始時刻がずれるために、波形のシフトが発生する。
n2=(1+ε)fs(t−T2) (6)
⇔(n2−m)=(1+ε)(n1−m)+εm−fsT21 (9)
τ(m)=−ε(m−M) (11)
(Mは定数)で与えられる遅延量τ(m;ε)をx2(n−τ(m;ε))として、チャンネル2に与えることにより次式を得る。
⇔(n2−m)=(n1−m)−fsT21+M (14)
x2(n2)←x2(n2−δ12) (20)
とする。これにより、信号x1(n1)と信号x2(n2)のミスマッチの原点を信号のオーバーラップするサンプル区間の中央付近に移動する。そして、遅延量τ(m)のMに、このオーバーラップの中央付近のサンプル番号を与える。
(1)探索範囲を等間隔に刻んでサンプリング周波数のミスマッチεを離散化し、
(2)離散化したサンプリング周波数のミスマッチεについて対数尤度関数J(V,ε)が最大となるものを探す。
(3)最大値を与える両隣の範囲を最適値の存在範囲として推定する。
a=ε*−1
b=ε*+1
(1)離散値全探索法では、N回の関数評価となる。
(2)黄金比探索法では、
第2の実施形態では、議事録作成のための会議録音など、録音後に信号処理により音声強調を行う応用を想定している。ある特定の音源だけが音を生じている時間区間である単一音源区間情報を録音信号に含めることで、この単一音源区間情報から録音開始時刻オフセットとサンプリング周波数のミスマッチの値を推定する手法を提案する。
n2=(1+ε)(t−T2)fs (33)
D1=n1(tB)−n1(tA) (17)
と置くと各チャンネル同区間においての相互相関のピーク差τA、τBを用いて次式で表される。
第3の実施形態では、x1(n)を参照チャンネル信号、x2(n)を対象チャンネル信号とよび、対象チャンネル信号x2(n)に信号処理を行うことによって、参照チャンネル信号x1(n)に同期させるものとする。ただし、nは離散時刻を表す。具体的には、マイクロホンアレー信号処理の適用を想定してSTFT領域上での同期を目的とし、時間領域上での同期が必要な場合には、最終段で逆STFTを行うことで行う。
τ0=−fsT21
nB1+τB=(1+ε)nB1+τ0 (53)
m1(r)=Mr (56)
のように、一定のフレームシフト長Mを適用してSTFT表現を求める。
w(l)(0≦l≦L−1)
は窓関数である。一方、対象チャンネル信号に対しては、推定されたミスマッチεと時間差τ0を用い、
m2(r)=(1+ε)m1(r)+τ0
=(1+ε)Mr+τ0 (58)
のようにフレーム中心を定めたいが、一般にこれは非整数となってしまう。
m2(r)=round[(1+ε)Mr+τ0] (59)
δ(r)=((1+ε)Mr+τ0)−round[(1+ε)Mr+τ0]
(60)
のように、m2(r)は整数部分のみとして小数部分をΔ(r)に分離し、整数サンプルシフトと周波数領域での位相補償による小数サンプルシフトを組み合わせ、次式のように対象チャンネル信号のSTFT表現を求める。
ε←ε+ε’ (63)
となるサンプリング周波数推定の修正を求める手法について述べる。起点となる第r0フレームは、フレーム数をRとして
r0=R/2 (64)
のように中央のフレームを与えるのが適当であろう。適切な位相補償を施したSTFT領域の多チャンネル信号
(a)当該音声信号処理装置10の動作及び処理を演算及び制御するコンピュータのCPU(中央演算処理装置)20と、
(b)オペレーションプログラムなどの基本プログラム及びそれを実行するために必要なデータを格納するROM(読み出し専用メモリ)21と、
(c)CPU20のワーキングメモリとして動作し、当該音声信号処理で必要なパラメータやデータを一時的に格納するRAM(ランダムアクセスメモリ)22と、
(d)当該音声信号処理において用いる各種データ(音声データ及びパラメータデータなど)を格納するためのハードディスクメモリ23と、
(e)例えばハードディスクメモリで構成され、CD−ROMドライブ装置45を用いて読み込んだ、図21〜図22の処理プログラム等(これらのプログラムはコンピュータにより実行可能なプログラムである。)を格納するプログラムメモリ24と、
(f)例えばボイスレコーダーなどの録音機器71,72とUSBインターフェース51,52を介して接続され、録音機器71,72とデータを送受信する通信インターフェース51と、
(g)所定のデータや指示コマンドを入力するためのキーボード41に接続され、キーボード41から入力されたデータや指示コマンドを受信して所定の信号変換などのインターフェース処理を行ってCPU20に伝送するキーボードインターフェース31と、
(h)CRTディスプレイ43上で指示コマンドを入力するためのマウス42に接続され、マウス42から入力されたデータや指示コマンドを受信して所定の信号変換などのインターフェース処理を行ってCPU20に伝送するマウスインターフェース32と、
(i)CPU20によって処理されたデータや設定指示画面、生成された信号波形及び信号データなどを表示するCRTディスプレイ43に接続され、表示すべき画像データをCRTディスプレイ43用の画像信号に変換してCRTディスプレイ43に出力して表示するディスプレイインターフェース33と、
(j)CPU20によって処理されたデータ及び所定の生成された信号波形及び信号データなどを印字するプリンタ44に接続され、印字すべき印字データの所定の信号変換などを行ってプリンタ44に出力して印字するプリンタインターフェース34と、
(k)図21〜図22の処理プログラムが記憶されたCD−ROM45aから当該プログラムのプログラムデータを読み出すCD−ROMドライブ装置45に接続され、読み出された画像処理プログラムのプログラムデータを所定の信号変換などを行ってプログラムメモリ24に転送するドライブ装置インターフェース35aと、
(l)所定のデータを記憶する、例えばハードディスクメモリなどの外部記憶装置60に接続され、読み出されたデータを所定の信号変換などを行ってCPU20又はハードディスクメモリ23に転送するドライブ装置インターフェース35bとを備え、
これらの回路20〜24、31〜34、35a、35b及び51、52はバス30を介して接続される。
以下、本発明と非特許文献との相違点について以下に説明する。
サンプリング周波数のミスマッチのために、2つのチャネル間の時間差がドリフトするが、非特許文献4は、各フレームから求まる時間差を平均してドリフトの傾きを直接求めている(非特許文献4の式(14))のに対して、本発明では、STFT領域での位相補償に基づき、最尤法により求めている。非特許文献4の場合には、反復計算が不要な代わりに、位相領域での平均演算のために、エイリアシングが生じる高周波数領域の情報が使えない。これに対して、本発明では、反復が必要ですが、十分に高速で動作し、補償しながら尤度を求めるので、高周波数領域の情報も使えるため、高い精度を得ることができる。
非特許文献4では、非特許文献5という従来法であるラグランジュ多項式補間により、リサンプリングを行っている。ただ、サンプリング周波数の補償方法は、選択肢があり、本発明でもミスマッチを推定した後に、こうした従来法を用いることはできる。
非特許文献4では、参照チャンネル信号でも、ミスマッチを補償する対象チャンネル信号でも、フレームシフトが一定になっているが、この場合、長時間録音だとお互いのフレーム関係がずれてくる。本発明では、フレームシフトを変えることを考慮しており、長時間録音にも対応可能である。
20…CPU、
21…ROM、
22…RAM、
23…ハードディスクメモリ、
24…プログラムメモリ、
30…バス、
31…キーボードインターフェース、
32…マウスインターフェース、
33…ディスプレイインターフェース、
34…プリンタインターフェース、
35a,35b…ドライブ装置インターフェース、
41…キーボード、
42…マウス、
43…CRTディスプレイ、
44…プリンタ、
45…CD−ROMドライブ装置、
45a…CD−ROM、
51,52…USBインターフェース、
60…外部記憶装置、
71,72…録音機器、
71a,72a…A/D変換器(ADC)。
Claims (15)
- 対象チャンネル信号と参照チャンネル信号との間に録音開始時刻差があり、上記参照チャンネル信号のA/D変換器と上記対象チャンネル信号のA/D変換器との間のサンプリング周波数のミスマッチがあるときに、上記対象チャンネル信号を上記参照チャンネル信号に同期させる音声信号処理装置において、
上記参照チャンネル信号に対して一定のフレームシフトを行うことにより、短時間フーリエ変換表現の参照チャンネル信号を求める一方、上記録音開始時刻差と上記サンプリング周波数のミスマッチとに基づいて、上記参照チャンネル信号と上記対象チャンネル信号の互いのフレーム中心が互いに対応するように、上記対象チャンネル信号に対して整数サンプルシフトと周波数領域での位相補償法による小数サンプルシフトを行うことにより短時間フーリエ変換表現の対象チャンネル信号を求める第1の信号処理手段を備えたことを特徴とする音声信号処理装置。 - サンプリング周波数のミスマッチを0と仮定し、時間区間信号を用いた時間差推定法を用いて上記参照チャンネル信号全体を第1の区間とみなし、当該第1の区間において上記参照チャンネル信号に対する対象チャンネル信号の録音開始時刻差を求める第1の前処理手段をさらに備えたことを特徴とする請求項1記載の音声信号処理装置。
- 上記参照チャンネル信号及び上記対象チャンネル信号から、それぞれ互いに対応する単一音源区間情報を有する第1区間及び第2の区間を選択し、当該2つの区間の単一音源区間情報を用いたサンプリング周波数のミスマッチ推定法を用いて、サンプリング周波数のミスマッチ及び録音開始時刻差を求める第2の前処理手段をさらに備えたことを特徴とする請求項1記載の音声信号処理装置。
- 上記短時間フーリエ変換表現の対象チャンネル信号及び上記短時間フーリエ変換表現の参照チャンネル信号に基づいて、上記サンプリング周波数のミスマッチに対する、上記短時間フーリエ変換表現の対象チャンネル信号に対して補償した観測信号の対数尤度が最大となる最尤推定法を用いてサンプリング周波数のミスマッチを推定する第2の信号処理手段をさらに備えたことを特徴とする請求項1〜3のうちのいずれか1つに記載の音声信号処理装置。
- 上記第2の信号処理手段は、離散値全探索法によりサンプリング周波数のミスマッチの範囲を絞り込んだ後、黄金比探索法により最適解であるサンプリング周波数のミスマッチを推定することを特徴とする請求項4記載の音声信号処理装置。
- 上記推定されたサンプリング周波数のミスマッチに基づいて、フレーム内の変化を無視する階段近似を用いて上記短時間フーリエ変換表現の対象チャンネル信号と上記短時間フーリエ変換表現の参照チャンネル信号との間の時間差を最小にする線形位相補償法を用いて、上記短時間フーリエ変換表現の対象チャンネル信号と上記短時間フーリエ変換表現の参照チャンネル信号とが同期するように補償する第3の信号処理手段をさらに備えたことを特徴とする請求項4又は5記載の音声信号処理装置。
- 上記短時間フーリエ変換表現の対象チャンネル信号と上記短時間フーリエ変換表現の参照チャンネル信号とに対して逆フーリエ変換することにより上記対象チャンネル信号及び上記参照チャンネル信号を求める第4の信号処理手段をさらに備えたことを特徴とする請求項1、3又は6記載の音声信号処理装置。
- 対象チャンネル信号と参照チャンネル信号との間に録音開始時刻差があり、上記参照チャンネル信号のA/D変換器と上記対象チャンネル信号のA/D変換器との間のサンプリング周波数のミスマッチがあるときに、上記対象チャンネル信号を上記参照チャンネル信号に同期させる音声信号処理装置により実行される音声信号処理方法において、
上記参照チャンネル信号に対して一定のフレームシフトを行うことにより、短時間フーリエ変換表現の参照チャンネル信号を求める一方、上記録音開始時刻差と上記サンプリング周波数のミスマッチとに基づいて、上記参照チャンネル信号と上記対象チャンネル信号の互いのフレーム中心が互いに対応するように、上記対象チャンネル信号に対して整数サンプルシフトと周波数領域での位相補償法による小数サンプルシフトを行うことにより短時間フーリエ変換表現の対象チャンネル信号を求める第1の信号処理ステップを備えたことを特徴とする音声信号処理方法。 - サンプリング周波数のミスマッチを0と仮定し、時間区間信号を用いた時間差推定法を用いて上記参照チャンネル信号全体を第1の区間とみなし、当該第1の区間において上記参照チャンネル信号に対する対象チャンネル信号の録音開始時刻差を求める第1の前処理ステップをさらに備えたことを特徴とする請求項8記載の音声信号処理方法。
- 上記参照チャンネル信号及び上記対象チャンネル信号から、それぞれ互いに対応する単一音源区間情報を有する第1区間及び第2の区間を選択し、当該2つの区間の単一音源区間情報を用いたサンプリング周波数のミスマッチ推定法を用いて、サンプリング周波数のミスマッチ及び録音開始時刻差を求める第2の前処理ステップをさらに備えたことを特徴とする請求項8記載の音声信号処理方法。
- 上記短時間フーリエ変換表現の対象チャンネル信号及び上記短時間フーリエ変換表現の参照チャンネル信号に基づいて、上記サンプリング周波数のミスマッチに対する、上記短時間フーリエ変換表現の対象チャンネル信号に対して補償した観測信号の対数尤度が最大となる最尤推定法を用いてサンプリング周波数のミスマッチを推定する第2の信号処理ステップをさらに備えたことを特徴とする請求項8〜10のうちのいずれか1つに記載の音声信号処理方法。
- 上記第2の信号処理ステップは、離散値全探索法によりサンプリング周波数のミスマッチの範囲を絞り込んだ後、黄金比探索法により最適解であるサンプリング周波数のミスマッチを推定することを特徴とする請求項11記載の音声信号処理方法。
- 上記推定されたサンプリング周波数のミスマッチに基づいて、フレーム内の変化を無視する階段近似を用いて上記短時間フーリエ変換表現の対象チャンネル信号と上記短時間フーリエ変換表現の参照チャンネル信号との間の時間差を最小にする線形位相補償法を用いて、上記短時間フーリエ変換表現の対象チャンネル信号と上記短時間フーリエ変換表現の参照チャンネル信号とが同期するように補償する第3の信号処理ステップをさらに備えたことを特徴とする請求項11又は12記載の音声信号処理方法。
- 上記短時間フーリエ変換表現の対象チャンネル信号と上記短時間フーリエ変換表現の参照チャンネル信号とに対して逆フーリエ変換することにより上記対象チャンネル信号及び上記参照チャンネル信号を求める第4の信号処理ステップをさらに備えたことを特徴とする請求項8、11又は13記載の音声信号処理方法。
- 請求項8〜14のうちのいずれか1つに記載の音声信号処理方法の各ステップを含むことを特徴とする、コンピュータにより読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013048084A JP6278294B2 (ja) | 2013-03-11 | 2013-03-11 | 音声信号処理装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013048084A JP6278294B2 (ja) | 2013-03-11 | 2013-03-11 | 音声信号処理装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014174393A true JP2014174393A (ja) | 2014-09-22 |
JP6278294B2 JP6278294B2 (ja) | 2018-02-14 |
Family
ID=51695653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013048084A Active JP6278294B2 (ja) | 2013-03-11 | 2013-03-11 | 音声信号処理装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6278294B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016063651A1 (ja) * | 2014-10-21 | 2016-04-28 | オリンパス株式会社 | 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム |
JP2016224914A (ja) * | 2015-05-29 | 2016-12-28 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 文書画像の二値化方法 |
WO2017061023A1 (ja) * | 2015-10-09 | 2017-04-13 | 株式会社日立製作所 | 音声信号処理方法および装置 |
CN109584898A (zh) * | 2018-12-29 | 2019-04-05 | 上海瑾盛通信科技有限公司 | 一种语音信号的处理方法、装置、存储介质及电子设备 |
CN110085264A (zh) * | 2019-04-30 | 2019-08-02 | 北京儒博科技有限公司 | 语音信号检测方法、装置、设备及存储介质 |
JP2020134659A (ja) * | 2019-02-18 | 2020-08-31 | 日本電信電話株式会社 | 信号処理装置、信号処理方法及び信号処理プログラム |
CN112735459A (zh) * | 2019-10-28 | 2021-04-30 | 清华大学 | 基于分布式麦克风的语音信号增强方法、服务器及系统 |
JP2022502158A (ja) * | 2018-09-28 | 2022-01-11 | メドトロニック ミニメド インコーポレイテッド | 注入デバイスおよび関連する食事ボーラス調整方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010212818A (ja) * | 2009-03-08 | 2010-09-24 | Univ Of Tokyo | 複数のマイクロフォンにより受信された多チャンネル信号の処理方法 |
JP2011080868A (ja) * | 2009-10-07 | 2011-04-21 | Hitachi Ltd | 音響監視システム、及び音声集音システム |
-
2013
- 2013-03-11 JP JP2013048084A patent/JP6278294B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010212818A (ja) * | 2009-03-08 | 2010-09-24 | Univ Of Tokyo | 複数のマイクロフォンにより受信された多チャンネル信号の処理方法 |
JP2011080868A (ja) * | 2009-10-07 | 2011-04-21 | Hitachi Ltd | 音響監視システム、及び音声集音システム |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016080968A (ja) * | 2014-10-21 | 2016-05-16 | オリンパス株式会社 | 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム |
US10356518B2 (en) | 2014-10-21 | 2019-07-16 | Olympus Corporation | First recording device, second recording device, recording system, first recording method, second recording method, first computer program product, and second computer program product |
WO2016063651A1 (ja) * | 2014-10-21 | 2016-04-28 | オリンパス株式会社 | 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム |
JP2016224914A (ja) * | 2015-05-29 | 2016-12-28 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | 文書画像の二値化方法 |
WO2017061023A1 (ja) * | 2015-10-09 | 2017-04-13 | 株式会社日立製作所 | 音声信号処理方法および装置 |
US10629222B2 (en) | 2015-10-09 | 2020-04-21 | Hitachi, Ltd. | Sound signal procession method and device |
JP2022502158A (ja) * | 2018-09-28 | 2022-01-11 | メドトロニック ミニメド インコーポレイテッド | 注入デバイスおよび関連する食事ボーラス調整方法 |
CN109584898A (zh) * | 2018-12-29 | 2019-04-05 | 上海瑾盛通信科技有限公司 | 一种语音信号的处理方法、装置、存储介质及电子设备 |
JP2020134659A (ja) * | 2019-02-18 | 2020-08-31 | 日本電信電話株式会社 | 信号処理装置、信号処理方法及び信号処理プログラム |
JP7126659B2 (ja) | 2019-02-18 | 2022-08-29 | 日本電信電話株式会社 | 信号処理装置、信号処理方法及び信号処理プログラム |
CN110085264A (zh) * | 2019-04-30 | 2019-08-02 | 北京儒博科技有限公司 | 语音信号检测方法、装置、设备及存储介质 |
CN110085264B (zh) * | 2019-04-30 | 2021-10-15 | 北京如布科技有限公司 | 语音信号检测方法、装置、设备及存储介质 |
CN112735459A (zh) * | 2019-10-28 | 2021-04-30 | 清华大学 | 基于分布式麦克风的语音信号增强方法、服务器及系统 |
CN112735459B (zh) * | 2019-10-28 | 2024-03-26 | 清华大学 | 基于分布式麦克风的语音信号增强方法、服务器及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP6278294B2 (ja) | 2018-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6278294B2 (ja) | 音声信号処理装置及び方法 | |
Miyabe et al. | Blind compensation of interchannel sampling frequency mismatch for ad hoc microphone array based on maximum likelihood estimation | |
US7895038B2 (en) | Signal enhancement via noise reduction for speech recognition | |
JP5124014B2 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
JP4774100B2 (ja) | 残響除去装置、残響除去方法、残響除去プログラム及び記録媒体 | |
JP5931661B2 (ja) | 音源方向推定装置、音源方向推定方法、及び音源方向推定プログラム | |
Miyabe et al. | Blind compensation of inter-channel sampling frequency mismatch with maximum likelihood estimation in STFT domain | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
JP4096104B2 (ja) | 雑音低減システム及び雑音低減方法 | |
US9190047B2 (en) | Acoustic signal processing device and method | |
JP5702685B2 (ja) | 音源方向推定装置及び音源方向推定方法 | |
JP2014219467A (ja) | 音信号処理装置、および音信号処理方法、並びにプログラム | |
Schmalenstroeer et al. | Multi-stage coherence drift based sampling rate synchronization for acoustic beamforming | |
CN111866665B (zh) | 麦克风阵列波束形成方法及装置 | |
JP2015084466A (ja) | サンプリングポイント調整装置および方法、並びにプログラム | |
Sakanashi et al. | Speech enhancement with ad-hoc microphone array using single source activity | |
Kheder et al. | Fast i-vector denoising using MAP estimation and a noise distributions database for robust speaker recognition | |
Chinaev et al. | Double-cross-correlation processing for blind sampling-rate and time-offset estimation | |
Lv et al. | A permutation algorithm based on dynamic time warping in speech frequency-domain blind source separation | |
Miyabe et al. | Optimizing frame analysis with non-integrer shift for sampling mismatch compensation of long recording | |
KR20070085193A (ko) | 잡음제거 장치 및 방법 | |
JP2019054344A (ja) | フィルタ係数算出装置、収音装置、その方法、及びプログラム | |
KR101418023B1 (ko) | 위상정보를 이용한 자동 이득 조절 장치 및 방법 | |
JP2006330687A (ja) | 信号分離装置、信号分離方法、そのプログラムおよび記録媒体 | |
Ganapathy et al. | Temporal resolution analysis in frequency domain linear prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170713 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6278294 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |