JP2005303898A - マイク位置決定方法、マイク位置決定装置、マイク位置決定プログラム - Google Patents

マイク位置決定方法、マイク位置決定装置、マイク位置決定プログラム Download PDF

Info

Publication number
JP2005303898A
JP2005303898A JP2004120377A JP2004120377A JP2005303898A JP 2005303898 A JP2005303898 A JP 2005303898A JP 2004120377 A JP2004120377 A JP 2004120377A JP 2004120377 A JP2004120377 A JP 2004120377A JP 2005303898 A JP2005303898 A JP 2005303898A
Authority
JP
Japan
Prior art keywords
microphone
level
microphone position
impulse response
wave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004120377A
Other languages
English (en)
Other versions
JP4173462B2 (ja
Inventor
Satoru Kobashigawa
哲 小橋川
Satoshi Takahashi
敏 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004120377A priority Critical patent/JP4173462B2/ja
Publication of JP2005303898A publication Critical patent/JP2005303898A/ja
Application granted granted Critical
Publication of JP4173462B2 publication Critical patent/JP4173462B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音声認識に係わる音声を取り込むためのマイク位置を効率良く決定するマイク位置決定方法及び装置を提案する。
【解決手段】話者模擬スピーカから音声認識用マイクまでのインパルス応答を音声認識用マイクの位置を変えて複数の位置毎に測定し、各位置毎に測定したインパルス応答の振幅の最大値の時刻の波、又はその周辺の時刻の波を直接波として直接波レベルを計算し、直接波以外の時刻の波を反射波として反射波レベルを計算し、直接波レベルと反射波レベルの比が最大となるマイク位置を最適なマイク位置とする。
【選択図】図3

Description

本発明は、音声認識に用いるマイクの位置を設定する際の最適なマイク位置を決めるマイク位置決定方法、マイク位置決定装置、マイク位置決定プログラムに関する。
従来、最適なマイク位置を決めるためには、話者位置に置いたスピーカからマイクまでの空間伝達特性、すなわちインパルス応答及び、利用環境においてマイクに混入する背景雑音を収録し、雑音の無いクリーンな環境で、かつ話者の口とマイクの位置が近い環境で収録された接話クリーン音声に対して、各マイク位置で測定したインパルス応答を畳み込み、収録した雑音を重畳することによって得られた各マイク位置の収録音声を模擬した音声に対して、実際に音声認識実験を行い、最も認識性能の高いマイク位置を最適なマイク位置としていた。
模擬音声を作成し、実際に認識実験により最適なマイク位置を決定する方法では、評価用の接話クリーン音声を作成したり、インパルス応答を畳み込み、収録した雑音を重畳した音声データを作成したり、実際に音声認識実験を行う時間やコスト、データ格納領域が必要となる。
本発明は、上記を鑑みてなされたもので、その目的とするところは、測定したインパルス応答及び収録した背景雑音から各マイク位置での模擬音声を作成し、実際に認識実験を行うのでは無く、インパルス応答及び背景雑音のデータから最適なマイク位置を決定することができる装置を提供することである。
上記目的を達成するために、請求項1で提案する本発明は、音声認識に用いる最適なマイク位置を決めるためのマイク位置決定方法において、マイク位置を順次移動させるか又は複数のマイクを切替えて各マイク位置におけるインパルス応答の直接波レベルと、反射波レベルの比を比べ、その比が最も大きいマイク位置を最適マイク位置とすることを要旨とする。
請求項1で提案する本発明にあっては、各マイク位置におけるインパルス応答を測定する。測定したインパルス応答のデータから図1に示すように測定したインパルス応答の振幅の絶対値レベルの最大値、又は最大値の時刻周辺の時刻の絶対値レベルの和をD(直接波レベル)とする。測定したインパルス応答のデータから図1に示すように直接波レベル以外の時刻の絶対値レベルの和をR(反射波レベル)とする。D/Rの比が最も大きいマイク位置を最適なマイク位置とする。
請求項2で提案する本発明は、音声認識に用いる最適なマイク位置を決めるためのマイク位置決定方法において、マイク位置を順次移動させるか又は複数のマイクを切替えて各マイク位置におけるインパルス応答の振幅の絶対値レベルの最大値と、インパルス応答のデータから音声認識に用いる分析フレームの幅を超えた区間のレベルの比を比べ、その比が最も大きいマイク位置を最適マイク位置とすることを要旨とする。
請求項2記載の本発明にあっては、各マイク位置におけるインパルス応答を測定する。測定したインパルス応答のデータから図2に示すように測定したインパルス応答の振幅の絶対値レベルの最大値、又は最大値の時刻周辺の時刻の絶対値レベルの和をD(直接波レベル)とする。測定したインパルス応答のデータから図2に示すようにインパルス応答のデータから直接波の時刻から音声認識に用いる分析フレームを超えた区間の振幅の絶対値レベルの和をR(反射波レベル)とする。D/Rの比が最も大きいマイク位置を最適なマイク位置とする。例えば、音声認識によく用いられるケプストラムやMFCCのような対数スペクトルに関連した特徴パラメータを用いて認識を行なう場合、その長時間平均を減算することにより、請求項2において無視したフレーム内に収まる伝達特性(インパルス応答)の影響を低減することが可能である。
請求項3で提案する本発明は、音声認識に用いる最適なマイク位置を決めるためのマイク位置決定方法において、請求項1及び請求項2記載のインパルス応答の振幅の直接波レベルと反射レベルの比に基づき、その比が大きい程最適とする判定に加え、各マイク位置に混入する背景雑音のレベルが低い程最適とする判定を加え、両判定結果が最も良好なものを最適なマイク位置とすることを要旨とする。
請求項3で提案する本発明にあっては、各マイク位置におけるインパルス応答を測定する。測定したインパルス応答の振幅の絶対値レベルの最大値、又は最大値の時刻周辺の時刻の絶対値レベルの和をD(直接波レベル)とする。前述の請求項1及び請求項2の方法で決めた反射レベルをRとする。各マイク位置で収録した雑音の振幅の絶対値の平均レベルをN(背景雑音レベル)とする。そして、直接波レベルと反射波レベルの比D/R、及び直接波レベルと背景雑音レベルの比D/Nの和が最も大きくなるようなマイク位置を最適なマイク位置とする。直接波レベルの大きさは、マイクに入力する音声のパワーレベルを示しており、直接波レベルと背景雑音レベルの比D/Nは、音声パワーレベルと背景雑音パワーレベル比であるS/Nと相関が高い。S/Nの大小は、音声認識の性能に多大な影響を与えるため、D/Nを知ることで認識性能の推定が可能である。
本発明によれば、各マイク位置における背景雑音の収録、インパルス応答の測定をするだけで、測定したインパルス応答を畳み込み背景雑音を重畳した模擬音声の作成から音声認識実験を行うことなく、最適なマイク位置を決定することができ、処理時間や計算コストを削減することが可能である。
以下、図面を用いて本発明の実施の形態について説明する。
図3は、本発明の請求項1及び2で提案する最適マイク位置決定装置のブロック図である。図3に示す最適マイク位置決定装置は、各マイク位置において測定したインパルス応答から得られる反射波のレベルRと、直接波のレベルDを比較することにより、最適なマイク位置を決定することを特徴とするものであり、評価関数(例えば、式(1))により各マイク位置を評価し、最適なマイク位置を決定する。
Q=D/R ………(1)
具体的に説明すると、図3に示すように本実施形態の最適マイク位置決定装置は、収録ゲイン調整モジュール100と、インパルス応答測定モジュール200と、評価関数計算モジュール300と、最適マイク位置決定モジュール400とによって構成される。
以上のように構成される最適マイク位置決定装置においては、先ず初期設定として、収録ゲインの調整を行う。図3の収録ゲイン調整モジュール100では、図4に示すように、基準信号メモリ101から基準信号を取り出し、収録ゲイン調整部102でゲインを調整し、D/A変換部103でアナログ信号に変換し、話者模擬スピーカSPから再生、音声認識用マイクMで収録し、収録した信号をA/D変換部104でディジタル信号に変換し、収録信号パワーレベル計算部105で収録信号のパワーレベルを計算し、収録信号パワーレベル判定部106で収録した信号のレベルが適正範囲に収まっているか否かを判定し、適正範囲内である場合は、レベル判定スイッチ107を適正レベル端子108側にし、基準信号パワーレベルメモリ110に収録信号のパワーレベルを格納する。適正範囲外であればレベル判定スイッチ107を不適正レベル端子109側にし、収録ゲイン調整部102で収録ゲインを調整し、再度基準信号の再生収録を行なう。ここで用いる基準信号は、音声の一文あるいは複数分でも良く、話者模擬スピーカSPからの再生レベルが通常の話者の音量レベルと同等にしておく。以上により収録ゲインの初期設定が完了する。
収録ゲイン調整部102の初期設定が終了後、図3のインパルス応答測定モジュール200でインパルス応答の測定を行う。図3のインパルス応答測定モジュール200では、図5に示すように、インパルス応答測定用信号メモリ201に保存してあるインパルス応答測定用信号を初期設定された収録ゲイン調整部102で調整し、D/A変換部103でアナログ信号に変換し、話者模擬スピーカSPから再生する。このとき、インパルス応答測定用信号メモリ201に格納されているインパルス応答測定用信号のゲインは、前記基準信号メモリ101に格納されている基準信号のゲインと同一である。
従って、話者模擬スピーカSPから放音されるインパルス応答測定用信号の音圧は基準信号メモリ101から読み出された基準信号の音圧と同一となる。
話者模擬スピーカSPから再生したインパルス応答測定用信号は、音声認識用マイクMで収録されて、A/D変換部202でディジタル信号に変換され、インパルス応答計算部203でインパルス応答に変換され、インパルス応答メモリ204に格納される。
そして、図3の評価関数計算モジュール300では、測定したインパルス応答からマイク位置の最適度を示す評価関数値を計算する。図3の評価関数計算モジュール300では、図6に示すように、測定したインパルス応答が格納されているインパルス応答メモリ204から読み出したインパルス応答の測定値から直接波レベルDを直接波レベル計算手段301で計算し、反射波レベル計算手段302で反射波レベルRを計算する。
ここで、この発明の請求項1及び4で提案するマイク位置決定方法及びマイク位置決定装置では直接波レベルを図1に示したインパルス応答の振幅の最大値の時刻の波又は、その周辺の時刻の波を直接波として計算し、直接波以外の時刻の波を反射波として反射波レベルRを計算する。
これに対して、この発明の請求項2及び5で提案するマイク位置決定方法及びマイク位置決定装置では直接波レベルDに関しては請求項1及び4と同じ計算方法を採るが、反射波レベルRに関しては図2に示すようにインパルス応答の直接波を示す時刻から音声認識に用いる分析フレーム幅(数10ms)を越える時刻以降を反射波として反射レベルRを計算する。
算出された直接波レベルDと反射波レベルRに基づいて評価関数計算部303は評価関数を、例えば式(1)により計算し、その計算結果を最適マイク位置決定モジュール400に入力する。
最適マイク位置決定モジュール400は図6に示すように、最大値判定スイッチ401と、最適マイク位置候補メモリ404と、評価関数最大値メモリ405と、非最適マイク位置候補メモリ406とによって構成される。
最大値判定スイッチ401では得られた評価関数値を評価関数最大値メモリ405に記録してある関数値と比較し、他のマイク位置で測定された評価関数値よりも大きいか否かの判定を行い、大きい場合はスイッチを最大値端子402側にし、評価関数の最大値を更新し、評価関数最大値メモリ405に格納している値を書き替え、最適マイク位置を更新し、最適マイク位置候補メモリ404の値を当該マイク位置のID(マイク位置を表わす番号)に書き換える。
評価関数値が他のマイク位置で測定された評価関数値よりも小さい場合は、スイッチ401を非最大値端子403側にし、非最適マイク位置候補メモリ406に当該マイク位置のIDを加える。全てのマイク位置における評価が終った段階で、最適マイク位置候補メモリ404に格納されているマイク位置のIDにより、最適マイク位置が決定される。
図7はこの発明の請求項3及び6で提案するマイク位置決定方法を実現するためのマイク位置決定装置の全体の構成を示す。図3に示したマイク位置決定装置と異なる構成は収録ゲイン調整モジュール100とインパルス応答測定モジュール200との間に、雑音レベル比調整モジュール50と、雑音収録モジュール60を追加した点である。
この追加された構成により図1乃至図6で説明した直接波レベルDと反射波レベルRの比に基づき、その比が大きい程最適とする判定に加えて、各マイク位置で混入する背景雑音のレベルNが低い程最適とする判定を加え、背景雑音の影響を含めた判定を得ようとするものである。
この場合の評価関数は次式で計算される。
Q=D/R+k・D/N ………(2)
k:インパルス応答と収録レベルのゲイン差の補正係数
図7に示す収録ゲイン調整モジュール100、インパルス応答測定モジュール200は図4、図5と同じであるから、ここでは追加された部分と、それに係わる部分について説明する。
図7に示す雑音レベル比調整モジュール50では、図8に示すように、話者模擬スピーカSPからは何も再生せず、背景雑音を音声認識用マイクMで収録し、収録した信号をA/D変換部でディジタルに変換し、背景雑音レベル測定手段52で雑音のパワーレベルを計算し、背景雑音パワーレベルメモリ53に格納し、図4の収録ゲイン調整モジュール100で格納した基準信号パワーレベルメモリ110に格納されている基準信号パワーレベルと合わせて基準/雑音レベル比メモリ55に格納する。
初期設定終了後、各マイク位置において、図9に示す雑音収録モジュール60で雑音の収録を行う。雑音収録モジュール60では、図9に示すように、音声認識用マイクMで収録した背景雑音信号を、A/D変換部61でディジタル信号に変換し、雑音パワーレベル計算部62で雑音のパワーレベルを計算し、雑音パワーレベルメモリ63に格納する。
評価関数計算モジュール300はこの実施形態では図10に示すように、インパルス応答メモリ204からインパルス測定値を読み出し、直接波レベル計算手段301と反射波レベル計算手段302で直接波レベルDと反射波レベルRを算出する。更に、雑音パワーレベルメモリ63から背景雑音パワーレベルを読み出し、この背景雑音パワーレベルを基準/雑音レベル比メモリ55に格納されている基準レベル/雑音レベルの比に基づき、雑音ゲイン調整部304で調整し、直接波レベル及び反射波レベルとレンジを合わせる。つまり、式(2)に示した補正係数kを決定する。得られた直接波レベルD及び反射波レベルR、雑音レベルNから、例えば式(2)のような評価関数を評価関数計算部303で計算する。評価関数計算部303の計算結果は最適マイク位置決定モジュール400で最大値がソートされ、最適マイク位置が決定される。
以下では、図11に示すフローチャートを参照してこの発明のマイク位置決定プログラムの概要を説明する。
どのような状態において、システムの初期設定を行ったかを判定する(ステップS91)。
初期設定を行ってない場合は、収録ゲインの調整を行い(ステップS92)、雑音レベル比の調整を行う(ステップS93)。
初期設定が終れば、全てのマイク位置の調査が終るまで(ステップS94)以下の手順を繰返す。
まず雑音を収録し、雑音のパワーレベルを求める(ステップS95)。
次にインパルス応答を測定する(ステップS96)。
得られたインパルス応答と、収録した雑音のパワーレベルから、直接波レベル、反射波レベル、雑音レベルを求め、マイク位置の最適性を評価する評価関数を計算する(ステップS97)。
評価関数値が他のマイクの評価関数値と比べて最大か否かを判定する(ステップS98)。
最大でない場合、当該マイク位置を、最適でないマイク位置のリストに登録し(ステップS99)、他のマイク位置があるのかの判定に戻る(ステップS94)。
最大である場合、最大評価関数値を更新し(ステップS100)、最適マイク位置候補に当該マイク位置を入れ替えて(ステップS101)、他のマイク位置があるかの判定に戻る(ステップS94)。
全てのマイク位置の判定が終った段階で最適マイク位置候補メモリに格納されているIDから最適マイク位置を出力する(ステップS102)。
を実行して終了する。
以上説明した本発明のマイク位置決定装置はコンピュータにマイク位置決定プログラムを解読させて実現することができる。この発明で提案するマイク位置決定プログラムはコンピュータが解読可能なプログラム言語によって記述され、磁気ディスク或はCD−ROM等の記録媒体に記録され、これら記録媒体からコンピュータにインストールされるか、又は通信回線を通じてコンピュータにインストールされ、コンピュータに備えられた中央演算処理装置に解読されてマイク位置決定装置として機能する。
この発明によるマイク位置決定装置は例えば自動音声案内装置のように音声認識機能を備えた装置を設置する場合に、音声認識用の音声を取り込むためのマイク位置決定時に活用される。
請求項1に示すインパルス応答から直接波レベルDと反射波レベルRの算出方法を説明するための図。 請求項2に示すインパルス応答から直接波レベルDと反射波レベルRの算出方法を説明するための図。 本発明によるマイク位置決定装置の実施形態を説明するためのブロック図。 図3に示すマイク位置決定装置の収録ゲイン調整モジュールを説明するためのブロック図。 図3に示すマイク位置決定装置のインパルス応答測定モジュールを説明するためのブロック図。 図3に示すマイク位置決定装置の評価関数計算モジュール及び最適マイク位置決定モジュールを説明するためのブロック図。 本発明によるマイク位置決定装置の他の実施形態を説明するためのブロック図。 図7に示すマイク位置決定装置の雑音レベル比調整モジュールを説明するためのブロック図。 図7に示すマイク位置決定装置の雑音収録モジュールを説明するためのブロック図。 図7に示すマイク位置決定装置の評価関数計算モジュール及び最適マイク位置決定モジュールを説明するためのブロック図。 図7に示すマイク位置決定装置をコンピュータに機能させるマイク位置決定プログラムの概要を説明するためのフローチャート。
符号の説明
50 雑音レベル比調整モジュール 203 インパルス応答計算部
60 雑音収録モジュール 204 インパルス応答メモリ
100 収録ゲイン調整モジュール 301 直接波レベル計算手段
200 インパルス応答測定モジュール 302 反射波レベル計算手段
300 評価関数計算モジュール 303 評価関数計算部
400 最適マイク位置決定モジュール 401 最大値判定スイッチ
SP 話者模擬スピーカ 404 最適マイク位置候補メモリ
M 音声認識用マイク 405 評価関数最大値メモリ
101 基準信号メモリ 406 非最適マイク位置候補メモリ
102 収録ゲイン調整部 51 A/D変換部
103 D/A変換部 52 背景雑音レベル測定手段
104 A/D変換部 53 背景雑音パワーレベルメモリ
105 収録信号パワーレベル計算部 54 基準/雑音レベル比計算部
106 収録信号パワーレベル判定部 55 基準/雑音レベル比メモリ
107 レベル判定スイッチ 61 A/D変換部
110 基準信号パワーレベルメモリ 62 雑音パワーレベル計算部
201 インパルス応答測定用信号メモリ 63 雑音パワーレベルメモリ
202 A/D変換器

Claims (7)

  1. 話者模擬スピーカから音声認識用マイクまでのインパルス応答を前記音声認識用マイクの位置を変えて複数の位置毎に測定し、各位置毎に測定したインパルス応答の振幅の最大値の時刻の波、又はその周辺の時刻の波を直接波として直接波レベルを計算し、直接波以外の時刻の波を反射波として反射波レベルを計算し、前記直接波レベルと前記反射波レベルの比が最大となるマイク位置を最適なマイク位置とするマイク位置決定方法。
  2. 話者模擬スピーカから音声認識用マイクまでのインパルス応答を前記音声認識用マイクの位置を変えて複数の位置毎に測定し、各位置毎に測定したインパルス応答の振幅の最大値の時刻の波、又はその周辺の時刻の波を直接波として直接波レベルを計算し、インパルス応答の直接波を示す時刻から音声認識に用いる分析フレーム幅を超える時刻以降を反射波として反射波レベルを計算し、前記直接波レベルと前記反射波レベルの比が最大となるマイク位置を最適なマイク位置とするマイク位置決定方法。
  3. 請求項1又は2記載のマイク位置決定方法の何れかにおいて、前記音声認識用マイクの位置を変えて複数の位置毎に前記音声認識用マイクに混入する背景雑音レベルを測定し、前記直接波レベルと前記背景雑音レベルの比を求め、その比と前記直接波レベルと反射波レベルとの比の和が最大となるマイク位置を最適なマイク位置とするマイク位置決定方法。
  4. 音声認識に用いる最適なマイク位置を決めるための装置であって、
    想定した話者の発話位置に置く話者を模擬した話者模擬スピーカと、音声認識用マイクと、前記話者模擬スピーカから音声認識用マイクまでのインパルス応答を前記音声認識用マイクの位置を変えて複数の位置毎に測定するインパルス応答測定手段と、前記各位置毎に測定したインパルス応答の振幅の最大値の時刻の波、又は、その周辺の時刻の波を直接波として直接波レベルを計算する直接波レベル計算手段と、直接波以外の時刻の波を反射波として反射波レベルを計算する反射波レベル計算手段と、前記直接波レベルと前記反射波レベルの比が最大となるマイク位置を最適なマイク位置とする最適マイク位置決定手段を有することを特徴とするマイク位置決定装置。
  5. 音声認識に用いる最適なマイク位置を決めるための装置であって、
    想定した話者の発話位置に置く話者を模擬した話者模擬スピーカと、音声認識用マイクと、前期話者模擬スピーカから音声認識用マイクまでのインパルス応答を前記音声認識用マイクの位置を変えて複数の位置毎に測定するインパルス応答測定手段と、前記各位置毎に測定したインパルス応答の振幅の最大値の時刻の波又はその周辺の時刻の波を直接波として直接波レベルを計算する直接波レベル計算手段と、インパルス応答の直接波を示す時刻から音声認識に用いる分析フレーム幅を超える時刻以降を反射波として反射波レベルを計算する反射波レベル計算手段と、前記直接波レベルと前記反射波レベルの比が最大となるマイク位置を最適なマイク位置とする最適マイク位置決定手段を有することを特徴とするマイク位置決定装置。
  6. 請求項4又は請求項5記載のマイク位置決定装置の何れかにおいて、前記音声認識用マイクの位置を変えて複数の位置毎に前記音声認識用マイクに混入する背景雑音を収録して背景雑音レベルを測定する背景雑音レベル測定手段と、前記直接波レベルと前記背景雑音レベルの比を求め、その比と前記直接波レベル及び反射波レベルの比の和が最大となるマイク位置を最適なマイク位置とする最適マイク位置決定手段を有することを特徴とするマイク位置決定装置。
  7. コンピュータが解読可能なプログラム言語によって記述され、コンピュータに前記請求項4乃至6記載のマイク位置決定装置の何れかの機能を実行させるマイク位置決定プログラム。
JP2004120377A 2004-04-15 2004-04-15 マイク位置決定方法、マイク位置決定装置、マイク位置決定プログラム Expired - Fee Related JP4173462B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004120377A JP4173462B2 (ja) 2004-04-15 2004-04-15 マイク位置決定方法、マイク位置決定装置、マイク位置決定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004120377A JP4173462B2 (ja) 2004-04-15 2004-04-15 マイク位置決定方法、マイク位置決定装置、マイク位置決定プログラム

Publications (2)

Publication Number Publication Date
JP2005303898A true JP2005303898A (ja) 2005-10-27
JP4173462B2 JP4173462B2 (ja) 2008-10-29

Family

ID=35334876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004120377A Expired - Fee Related JP4173462B2 (ja) 2004-04-15 2004-04-15 マイク位置決定方法、マイク位置決定装置、マイク位置決定プログラム

Country Status (1)

Country Link
JP (1) JP4173462B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012039501A (ja) * 2010-08-10 2012-02-23 Jvc Kenwood Corp ディジタルフィルタの係数設定方法、係数設定装置、及び係数設定プログラム、並びにディジタルフィルタを用いた音場補正方法
KR101323386B1 (ko) 2012-08-13 2013-10-29 한국 한의학 연구원 발성 크기 정보 획득을 위한 음성 녹음 장치 및 그 방법
KR20190104100A (ko) * 2019-08-19 2019-09-06 엘지전자 주식회사 마이크의 배치 적합도를 결정하는 방법 및 이를 위한 장치
CN111951833A (zh) * 2020-08-04 2020-11-17 科大讯飞股份有限公司 语音测试方法、装置、电子设备和存储介质
JP2021118461A (ja) * 2020-01-27 2021-08-10 沖電気工業株式会社 収音装置、収音プログラム、及び収音方法
US20220076667A1 (en) * 2020-09-08 2022-03-10 Kabushiki Kaisha Toshiba Speech recognition apparatus, method and non-transitory computer-readable storage medium
WO2023080341A1 (en) * 2021-11-02 2023-05-11 Samsung Electronics Co., Ltd. Dynamic positioning of ai speaker in an iot ecosystem

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012039501A (ja) * 2010-08-10 2012-02-23 Jvc Kenwood Corp ディジタルフィルタの係数設定方法、係数設定装置、及び係数設定プログラム、並びにディジタルフィルタを用いた音場補正方法
KR101323386B1 (ko) 2012-08-13 2013-10-29 한국 한의학 연구원 발성 크기 정보 획득을 위한 음성 녹음 장치 및 그 방법
KR20190104100A (ko) * 2019-08-19 2019-09-06 엘지전자 주식회사 마이크의 배치 적합도를 결정하는 방법 및 이를 위한 장치
KR102181643B1 (ko) * 2019-08-19 2020-11-23 엘지전자 주식회사 마이크의 배치 적합도를 결정하는 방법 및 이를 위한 장치
US11568202B2 (en) 2019-08-19 2023-01-31 Lg Electronics Inc. Method and apparatus for determining goodness of fit related to microphone placement
JP2021118461A (ja) * 2020-01-27 2021-08-10 沖電気工業株式会社 収音装置、収音プログラム、及び収音方法
CN111951833A (zh) * 2020-08-04 2020-11-17 科大讯飞股份有限公司 语音测试方法、装置、电子设备和存储介质
US20220076667A1 (en) * 2020-09-08 2022-03-10 Kabushiki Kaisha Toshiba Speech recognition apparatus, method and non-transitory computer-readable storage medium
US11978441B2 (en) * 2020-09-08 2024-05-07 Kabushiki Kaisha Toshiba Speech recognition apparatus, method and non-transitory computer-readable storage medium
WO2023080341A1 (en) * 2021-11-02 2023-05-11 Samsung Electronics Co., Ltd. Dynamic positioning of ai speaker in an iot ecosystem

Also Published As

Publication number Publication date
JP4173462B2 (ja) 2008-10-29

Similar Documents

Publication Publication Date Title
CN111161752B (zh) 回声消除方法和装置
CN101385386B (zh) 混响除去装置和混响除去方法
JP6572894B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20210256971A1 (en) Detection of replay attack
US8160273B2 (en) Systems, methods, and apparatus for signal separation using data driven techniques
KR20080111290A (ko) 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법
JP4745916B2 (ja) 雑音抑圧音声品質推定装置、方法およびプログラム
KR20090123921A (ko) 신호 분리를 위한 시스템, 방법 및 장치
JP2015019124A (ja) 音声処理装置、音声処理方法、及び音声処理プログラム
US20060100809A1 (en) Transmission characteristic measuring device transmission characteristic measuring method, and amplifier
CN110475181B (zh) 设备配置方法、装置、设备和存储介质
JP4173462B2 (ja) マイク位置決定方法、マイク位置決定装置、マイク位置決定プログラム
CN117693791A (zh) 言语增强
US8577051B2 (en) Sound signal compensation apparatus and method thereof
CN109741761B (zh) 声音处理方法和装置
JP5217875B2 (ja) 音場支援装置、音場支援方法およびプログラム
CN102903367A (zh) 离线迭代的声重放系统频响均衡方法和装置
CN117643075A (zh) 用于言语增强的数据扩充
CN115273826A (zh) 歌声识别模型训练方法、歌声识别方法及相关装置
WO2022071188A1 (ja) 音響処理方法および音響処理システム
WO2024024468A1 (ja) 情報処理装置および方法、符号化装置、音声再生装置、並びにプログラム
Han et al. Switching linear dynamic transducer for stereo data based speech feature mapping
JP5172797B2 (ja) 残響抑圧装置とその方法と、プログラムと記録媒体
WO2022230450A1 (ja) 情報処理装置、情報処理方法、情報処理システムおよびプログラム
JP5033109B2 (ja) 音響エコーキャンセラ装置とその方法と、プログラムと記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060725

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080805

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080813

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130822

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees