JP2023080734A

JP2023080734A - 収音装置

Info

Publication number: JP2023080734A
Application number: JP2021194233A
Authority: JP
Inventors: 孝朗山邊; Takao Yamabe
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2021-11-30
Filing date: 2021-11-30
Publication date: 2023-06-09

Abstract

【課題】振動センサが生成する振動信号に基づく音声信号の品質をより向上させることができる収音装置を提供する。【解決手段】マイクロフォン１は空気振動に基づく音声信号を生成する。振動センサ３は人体に伝わる振動に基づく振動信号を生成する。適応フィルタ６は振動信号に係数を乗算して変換音声信号を生成する。減算器７は音声信号と変換音声信号との差分である残差信号を生成する。適応制御部５は、音声区間であると判定されるときには、適応フィルタ６が第１の速度で残差信号が小さくなるように係数を更新するよう制御し、非音声区間であると判定されるときには、適応フィルタ６が第１の速度より遅い第２の速度で残差信号が小さくなるように係数を更新するよう制御するか、係数を更新しないように制御する適応フィルタ制御信号を適応フィルタ６に供給する。【選択図】図１

Description

本発明は、収音装置に関する。

特許文献１及び２には、空気振動に基づいて音声信号を生成するマイクロフォン、及び骨振動に基づいて音声信号に相当する振動信号を生成する振動センサを備えることにより、騒音環境下において明瞭な音声を取得することができる収音装置が記載されている。前者のマイクロフォンは気導マイクロフォンと称されることがあり、後者の振動センサは骨導マイクロフォンと称されることがある。

特許文献１に記載の収音装置は、振動センサが生成する振動信号を音声信号に変換するフィルタリング部を備え、静穏下においても振動センサが生成する振動信号に基づく音声信号を出力する。特許文献１に記載の収音装置は、フィルタリング部より出力される音声信号とマイクロフォンが生成する音声信号との差分である誤差信号が小さくなるようにフィルタリング部のフィルタ係数を更新するように構成されている。

特許文献２に記載の収音装置は、マイクロフォンが生成する音声信号と振動センサが生成する振動信号とを所定の混合比で混合する。特許文献２に記載の収音装置は、静穏下ではマイクロフォンが生成する音声信号の比率を多くし、雑音環境下では振動センサが生成する振動信号の比率を多くするように構成されている。

特開２００７－２５１３５４号公報特開２０００－２６１５３４号公報特許第５８７４３４４号公報特許第５９４８９１８号公報

マイクロフォンが生成する音声信号と振動センサが生成する振動信号に基づく音声信号とでは音声信号の品質に差があることから、収音装置は、静穏下であればマイクロフォンが生成する音声信号を出力することが好ましい。特許文献１においては、誤差信号が小さくなるようにフィルタリング部のフィルタ係数を更新することによって、振動信号に基づく音声信号の品質を向上させることを意図している。しかしながら、例えば雑音環境下ではマイクロフォンが生成する音声信号には環境雑音が含まれ、振動信号に基づく音声信号の品質を向上させることができない場合があり、改良が求められている。

本発明は、振動センサが生成する振動信号に基づく音声信号の品質をより向上させることができ、マイクロフォンが生成する音声信号と振動センサが生成する振動信号に基づく音声信号とを環境に応じて適切に選択することができる収音装置を提供することを目的とする。

本発明は、空気振動に基づく音声信号を生成するマイクロフォンと、人体に伝わる振動に基づく振動信号を生成する振動センサと、前記振動信号を前記音声信号に近付けるように補正するために、前記振動信号に係数を乗算して変換音声信号を生成する適応フィルタと、前記音声信号と前記変換音声信号との差分である残差信号を生成する減算器と、音声が存在する音声区間であると判定されるときには、前記適応フィルタが第１の速度で前記残差信号が小さくなるように前記係数を更新するよう制御し、音声が存在しない非音声区間であると判定されるときには、前記適応フィルタが前記第１の速度より遅い第２の速度で前記残差信号が小さくなるように前記係数を更新するよう制御するか、前記係数を更新しないように制御する適応フィルタ制御信号を生成して前記適応フィルタに供給する適応制御部と、前記音声信号と前記変換音声信号とを選択するか両者を混合して出力するセレクタとを備える収音装置を提供する。

本発明の収音装置によれば、振動センサが生成する振動信号に基づく音声信号の品質をより向上させることができ、マイクロフォンが生成する音声信号と振動センサが生成する振動信号に基づく音声信号とを環境に応じて適切に選択することができる。

一実施形態の収音装置を示すブロック図である。マイクロフォンが生成した音声信号を示す波形図である。振動センサが生成した振動信号を示す波形図である。音声信号及び振動信号の周波数特性を示す特性図である。図１の適応制御部５の具体的な構成例を示すブロック図である。図４の音声区間検出部５１及び５２による検出信号と、音圧レベル比算出部５５によって生成される環境雑音レベルとに基づいて適応フィルタ制御信号を生成する場合のパターンを示す図である。図４の音声区間検出部５１及び５２による検出信号と、相関度算出部５６によって算出される相関度とに基づいて適応フィルタ制御信号を生成する場合のパターンを示す図である。音声信号と適応フィルタ制御信号との関係を示す波形図である。図１の適応フィルタ６の具体的な構成例を示すブロック図である。図１の環境雑音分析部８の具体的な構成例を示すブロック図である。図１のセレクタ９が音声信号と変換音声信号とを選択する動作の一例を示す図である。

以下、一実施形態の収音装置について、添付図面を参照して説明する。図１は、一実施形態の収音装置１００を示す。図１において、マイクロフォン１は空気振動に基づいて音声信号を生成する。マイクロフォン１より出力される音声信号は、人が耳を通して知覚する音声に近いため、後述する振動信号を音声信号に変換する際の目標値となる。Ａ／Ｄ変換器２は、マイクロフォン１より供給されるアナログの音声信号をＡ／Ｄ変換して、デジタルの音声信号を適応制御部５、減算器７、環境雑音分析部８、セレクタ９に供給する。

振動センサ３は、人体に伝わる振動に基づいて振動信号を生成する。振動センサ３は、人体の表面に接触するように配置されている。体内に埋め込まれている振動受信装置、人体と直に接するように配置されたマイクロフォン、人体の表面に伝わる振動を映像として取得するカメラ、人体の表面に伝わる振動を位置情報として取得する距離計は、振動センサに含まれる。Ａ／Ｄ変換器４は、振動センサ３より供給されるアナログの振動信号をＡ／Ｄ変換して、デジタルの振動信号を適応制御部５、適応フィルタ６、環境雑音分析部８に供給する。

図２Ａはマイクロフォン１が生成した音声信号であり、図２Ｂは図２Ａの音声信号と同じ期間に振動センサ３が生成した振動信号である。図２Ａと図２Ｂとを比較すれば分かるように、音声信号と振動信号とは音圧レベルが相違する。図３は、音声信号及び振動信号の周波数特性を示している。一部の周波数帯域において、破線で示す振動信号の音圧レベルは実線で示す音声信号の音圧レベルよりも小さい。振動信号をスピーカに供給して音声として出力すると、マイクロフォン１が生成した音声信号をスピーカに供給して音声として出力する場合と比較して籠った音声となり、本来の音声とは異なって聞こえる。

図１に戻り、適応制御部５は、Ａ／Ｄ変換器２より出力された音声信号、Ａ／Ｄ変換器４より出力された振動信号、減算器７より出力された残差信号に基づいて、適応フィルタ６を制御する適応フィルタ制御信号を生成して、適応フィルタ６及び環境雑音分析部８に供給する。適応フィルタ６は、後述するように、振動信号をマイクロフォン１が生成した音声信号に近付けるように補正することによって変換音声信号を生成して、減算器７及びセレクタ９に供給する。

減算器７は、適応フィルタ６より出力された変換音声信号と、Ａ／Ｄ変換器２より出力された音声信号との差分を残差信号として、適応制御部５及び適応フィルタ６に供給する。

図４は、適応制御部５の具体的な構成例を示す。概略的には、適応制御部５は、発話等の音声が存在する音声区間であるか音声が存在しない非音声区間であるかに応じて、適応フィルタ６の動作を異ならせるための適応フィルタ制御信号を生成する。

適応制御部５は、音声区間検出部５１及び５２、音圧レベル取得部５３、音圧レベル比算出部５５、残差相対レベル取得部５４、相関度算出部５６、適応フィルタ学習速度設定部５７を備える。音声区間検出部５１及び５２はＶＡＤ（Voice Activity Detection）と称される技術によって、それぞれ、音声信号及び振動信号の音声区間を検出する。音声区間検出部５１及び５２は、少なくとも音圧レベルが所定のレベルを超えるか否かによって音声区間を検出する。

音声区間検出部５１及び５２は、音声区間の検出精度を向上させるため、特許文献３または４に記載の技術を採用し、周波数を分析して人の声の特徴を検出することによって、音声区間を検出してもよい。音声区間検出部５１及び５２は、それぞれ、音声信号及び振動信号の音声区間と非音声区間とを識別する検出信号を適応フィルタ学習速度設定部５７に供給する。

音圧レベル取得部５３は、音声信号及び振動信号の音圧レベルを取得する。音圧レベル比算出部５５は、音声信号の音圧レベルと振動信号の音圧レベルとの比である音圧レベル比を算出して、適応フィルタ学習速度設定部５７に供給する。音声信号及び振動信号の音圧レベルは、単位時間当たりの音圧の平均振幅値で表されていてもよいし、単位時間当たりの音圧の二乗和で表されていてもよい。発話区間の音圧レベル比と非発話区間の音圧レベル比は環境雑音レベルによって異なる。よって、音圧レベル比算出部５５が算出する音圧レベル比は、環境雑音レベルを示す。

残差相対レベル取得部５４には、減算器７より出力された残差信号と、Ａ／Ｄ変換器４より出力された振動信号が入力される。音声区間においては、マイクロフォン１には発話等による空気振動が入力され、振動センサ３には発話等による振動が伝達するので、残差信号は低レベルとなる。非音声区間において、または音声区間において環境雑音が存在すると、残差信号は比較的高レベルとなる。残差相対レベル取得部５４は、減算器７より出力された残差信号のレベルを、振動信号のレベルで正規化して、残差相対レベルを取得する。

振動信号が大きいほど、残差信号のレベルが大きくなる傾向となる。そこで、残差信号のレベルを振動信号のレベルで正規化することによって、振動信号の大きさに影響されない残差信号のレベルである残差相対レベルを得ることができる。

相関度算出部５６は、残差相対レベルを所定の閾値（第２の閾値）と比較して相関度を算出する。相関度算出部５６は、残差相対レベルが閾値以下であれば音声信号と振動信号との相関が高いと判定して、相関が高いことを示す値を有する相関度を出力する。相関度算出部５６は、残差相対レベルが閾値を超えれば音声信号と振動信号との相関が低いと判定して、相関が低いことを示す値を有する相関度を出力する。

適応フィルタ学習速度設定部５７は、少なくとも、音声区間検出部５１及び５２による検出信号に基づいて音声区間と非音声区間とを判別して適応フィルタ制御信号を生成する。

適応フィルタ６をより良好に動作させるために、適応フィルタ学習速度設定部５７は、音声区間検出部５１及び５２による検出信号と、音圧レベル比算出部５５によって生成される環境雑音レベルとに基づいて適応フィルタ制御信号を生成するのがよい。適応フィルタ６をより良好に動作させるために、適応フィルタ学習速度設定部５７は、音声区間検出部５１及び５２による検出信号と、相関度算出部５６による判定結果とに基づいて適応フィルタ制御信号を生成してもよい。

図５は、音声区間検出部５１及び５２による検出信号と、音圧レベル比算出部５５によって生成される環境雑音レベルとに基づいて適応フィルタ制御信号を生成する場合のパターン＃１～＃４を示している。図５における音声区間検出とは、音声区間検出部５１による検出信号と音声区間検出部５２による検出信号とを総合して、音声区間である（オン）か音声区間ではない（オフ）かを判定した結果を示す。

適応フィルタ学習速度設定部５７は、音声区間検出部５１による検出信号と音声区間検出部５２による検出信号とのいずれか一方が音声区間であることを示せば、音声区間である（オン）と判定してもよい。逆に、適応フィルタ学習速度設定部５７は、いずれか一方が非音声区間であることを示せば、音声区間ではない（オフ）と判定してもよい。

図５に示すように、適応フィルタ学習速度設定部５７は、パターン＃１として、音声区間検出がオフ、環境雑音レベルが所定の閾値（第１の閾値）以下である低レベルであれば、学習速度をセーブと設定する。適応フィルタ学習速度設定部５７は、パターン＃２として、音声区間検出がオン、環境雑音レベルが低レベルであれば、学習速度をアクティブと設定する。

適応フィルタ学習速度設定部５７は、パターン＃３として、音声区間検出がオフ、環境雑音レベルが所定の閾値を超える高レベルであれば、学習速度をセーブと設定する。適応フィルタ学習速度設定部５７は、パターン＃４として、音声区間検出がオン、環境雑音レベルが高レベルであれば、学習速度をセーブと設定する。学習速度がアクティブであるとは、適応フィルタ６における適応動作を積極的に促すことを意味し、学習速度がセーブであるとは、適応フィルタ６における適応動作を抑えるか停止することを意味する。

具体的には、適応フィルタ６における適応動作を積極的に促すとは、適応フィルタ６が第１の速度で短時間のうちに、振動信号に乗算する後述する係数を更新するよう制御することを意味する。適応フィルタ６における適応動作を抑えるとは、適応フィルタ６が第１の速度より遅い第２の速度で長時間をかけて、係数を更新するよう制御することを意味する。適応フィルタ６における適応動作を停止するとは、係数を更新しないよう制御することを意味する。

図６は、音声区間検出部５１及び５２による検出信号と、相関度算出部５６によって算出される相関度とに基づいて適応フィルタ制御信号を生成する場合のパターン＃５～＃８を示している。図６における音声区間検出は、図５における音声区間検出と同じである。

図６に示すように、適応フィルタ学習速度設定部５７は、パターン＃５として、音声区間検出がオフで相関度が高ければ、学習速度をセーブと設定する。適応フィルタ学習速度設定部５７は、パターン＃６として、音声区間検出がオンで相関度が高ければ、学習速度をアクティブと設定する。

適応フィルタ学習速度設定部５７は、パターン＃７として、音声区間検出がオフで相関度が低ければ、学習速度をセーブと設定する。適応フィルタ学習速度設定部５７は、パターン＃８として、音声区間検出がオンで相関度が低ければ、学習速度をセーブと設定する。

図５に示すように、適応フィルタ学習速度設定部５７は、音声区間であり、かつ、環境雑音レベルが低レベル（第１の閾値以下）であるという第１の条件を満たすとき、適応フィルタ６における学習速度をアクティブとする適応フィルタ制御信号を生成するのがよい。適応フィルタ学習速度設定部５７は、第１の条件を満たさないとき、適応フィルタ６における学習速度をセーブとする適応フィルタ制御信号を生成するのがよい。

図６に示すように、適応フィルタ学習速度設定部５７は、音声区間であり、かつ、相関度が高い（残差相対レベルが第２の閾値以下である）いう第２の条件を満たすとき、適応フィルタ６における学習速度をアクティブとする適応フィルタ制御信号を生成するのがよい。適応フィルタ学習速度設定部５７は、第２の条件を満たさないとき、適応フィルタ６における学習速度をセーブとする適応フィルタ制御信号を生成するのがよい。

学習速度をアクティブとすれば、適応フィルタ６は第１の速度で係数を更新する。学習速度をセーブとすれば、適応フィルタ６は第１の速度より遅い第２の速度で係数を更新するか、係数を更新しない。

適応フィルタ学習速度設定部５７は、音声区間検出と、環境雑音レベルと、相関度とに基づいて適応フィルタ制御信号を生成してもよい。この場合、環境雑音レベルと相関度とのうちのいずれか一方を優先して、アクティブとセーブとのいずれかを設定してもよい。また、環境雑音レベルと相関度とをそれぞれポイント化して、適応フィルタ学習速度設定部５７は、環境雑音レベルのポイントと相関度のポイントとを総合して音声区間であるか否かを判定して、アクティブとセーブとのいずれかを設定してもよい。

図７は、（ａ）に示す音声信号と（ｂ）に示す適応フィルタ制御信号との関係を示している。適応フィルタ制御信号は、音声信号の音声区間にハイ、非音声区間にローとなる。適応フィルタ制御信号のハイはアクティブを示し、適応フィルタ制御信号のローはセーブを示す。ここでは、音声区間の環境雑音レベルは低レベルであり、音声信号と振動信号との相関度は高いとする。

図８は、ＦＩＲフィルタを用いた適応フィルタ６の具体的な構成例を示す。適応フィルタ６は、適応係数更新部６１、遅延器６２１～６２ｎ、乗算器６３０～６３ｎ、加算器６４１～６４ｎを備える。ｎは数十から数百程度の数である。遅延器６２１～６２ｎは、入力されたデジタルの振動信号の各サンプルを１クロックずつ遅延して出力する。乗算器６３０～６３ｎは、遅延器６２１に入力されるサンプルと遅延器６２１～６２ｎより出力される各サンプルとにそれぞれ係数を乗算して出力する。

加算器６４１～６４ｎは、それぞれ、乗算器６３０及び６３１の出力、加算器６４１及び乗算器６３２の出力、加算器６４２及び乗算器６３の出力、…、加算器６４（ｎ－１）（図示せず）及び乗算器６３ｎの出力を加算する。これにより、加算器６４ｎは、Ａ／Ｄ変換器４より出力された振動信号を、Ａ／Ｄ変換器２より出力された音声信号に近付けるように補正した変換音声信号を出力する。

減算器７は、加算器６４ｎより出力された変換音声信号と、Ａ／Ｄ変換器２より出力された音声信号との差分である残差信号を出力する。適応係数更新部６１は、残差信号が小さくなるように、乗算器６３０～６３ｎが入力されるサンプルに乗算する係数を更新する。

このとき、適応係数更新部６１は、適応フィルタ制御信号がアクティブを示すハイであるときには、乗算器６３０～６３ｎに供給する係数を残差信号が小さくなるように短時間で更新する。適応係数更新部６１は、適応フィルタ制御信号がセーブを示すローであるときには、乗算器６３０～６３ｎに供給する係数を残差信号が小さくなる方向に長時間をかけて更新するか、係数を更新しない。

図５で説明したように、適応制御部５は、音声区間検出部５１及び５２が音声区間であることを検出しても、環境雑音レベルが高レベルであれば適応フィルタ制御信号を適応フィルタ６における学習速度をセーブに設定するローとする。環境雑音レベルが高レベルであるときに乗算器６３０～６３ｎに供給する係数を更新すると、振動信号を環境雑音に近似させて変換音声信号の音質を低下させてしまうことがある。

また、図６で説明したように、適応制御部５は、音声区間検出部５１及び５２が音声区間であることを検出しても、相関度が低ければ、適応フィルタ制御信号をローとする。同様に、相関度が低いときに乗算器６３０～６３ｎに供給する係数を更新すると変換音声信号の音質を低下させてしまうことがある。

そこで、適応係数更新部６１は、適応フィルタ制御信号がローであれば、係数を更新しないか、更新するとしても即座には更新せず、長時間をかけて徐々に更新するのがよい。適応フィルタ６は、環境雑音レベルが高レベルとなる前または相関度が低くなる前までの学習によって、振動信号を音声信号に近付ける係数を得て、音声品質が良好な変換音声信号を出力している。従って、適応フィルタ６は、環境雑音レベルが高レベルとなったり、相関度が低くなったりする短時間だけ、係数を更新しなくても、音声品質が良好な変換音声信号を継続して出力することができる。

図９は、環境雑音分析部８の具体的な構成例を示す。環境雑音分析部８は、音圧レベル取得部８１及び８２、音圧レベル比算出部８３、セレクタ制御信号設定部８４を備える。音圧レベル取得部８１は、Ａ／Ｄ変換器２より出力された音声信号の音圧レベルを取得する。音圧レベル取得部８２は、Ａ／Ｄ変換器４より出力された振動信号の音圧レベルを取得する。音圧レベル比算出部８３は、音声信号の音圧レベルと振動信号の音圧レベルとの比である音圧レベル比を算出する。音圧レベル比算出部８３が算出する音圧レベル比は、環境雑音レベルを示す。

音圧レベル取得部８１及び８２と音圧レベル比算出部８３は、図４に示す適応制御部５内の音圧レベル取得部５３及び音圧レベル比算出部５５と実質的に同じ構成である。よって、適応制御部５内の音圧レベル取得部５３及び音圧レベル比算出部５５を環境雑音分析部８の一部として供用することも可能である。

環境雑音分析部８は、音声区間における発話等の音声に環境雑音が影響を及ぼしていなければセレクタ９によってＡ／Ｄ変換器２より出力された音声信号を選択し、影響を及ぼしていればセレクタ９によって適応フィルタ６より出力された変換音声信号を選択するために設けられている。

セレクタ制御信号設定部８４には、音圧レベル比算出部８３より出力される音圧レベル比と、適応制御部５より供給される適応フィルタ制御信号とが入力される。セレクタ制御信号設定部８４に適応フィルタ制御信号を入力しているのは、非音声区間における環境雑音レベルに基づいて、Ａ／Ｄ変換器２より出力された音声信号と適応フィルタ６より出力された変換音声信号とを選択するためのセレクタ制御信号を生成するためである。音声区間における環境雑音レベルは音声の影響を受けるため、真の環境雑音レベルを示さないことがある。

セレクタ制御信号設定部８４は、非音声区間における環境雑音レベルが所定の閾値（第３の閾値）以下であれば音声信号を選択し、閾値を超えれば変換音声信号を選択するセレクタ制御信号を生成してセレクタ９に供給する。セレクタ制御信号設定部８４が用いる第３の閾値は、適応フィルタ学習速度設定部５７が用いる第１の閾値と同じ値であってもよいし、異なる値であってもよい。

図１０は、セレクタ９が音声信号と変換音声信号とを選択する動作の一例を示している。図１０において、時刻ｔ１以前で環境雑音レベルが閾値以下で、環境雑音は音声区間の音声に影響を及ぼしていない。時刻ｔ１～ｔ３では、環境雑音レベルが閾値を超えて環境雑音が音声区間の音声に影響を及ぼしている。時刻ｔ３以降で、環境雑音は音声区間の音声に影響を及ぼさない状態に戻っている。

この場合、環境雑音分析部８は時刻ｔ１以前で音声信号を選択するセレクタ制御信号をセレクタ９に供給しており、セレクタ９は音声信号を選択して出力する。時刻ｔ１を過ぎると、環境雑音分析部８は変換音声信号を選択するセレクタ制御信号をセレクタ９に供給する。セレクタ９は、即座に音声信号を変換音声信号に切り替えるのではなく、時刻ｔ１～ｔ２の時間をかけて、音声信号の音圧レベルを逓減させ、変換音声信号の音圧レベルを逓増させながら、時刻ｔ２で変換音声信号に切り替える。

時刻ｔ３を過ぎると、環境雑音分析部８は音声信号を選択するセレクタ制御信号をセレクタ９に供給する。同様に、セレクタ９は、時刻ｔ３～ｔ４の時間をかけて、変換音声信号の音圧レベルを逓減させ、音声信号の音圧レベルを逓増させながら、時刻ｔ４で音声信号に切り替える。

セレクタ９は、音声信号と変換音声信号とを互いに切り替える際に、一方の音圧レベルを逓減させ、他方の音圧レベルを逓増させながら、音声信号と変換音声信号とを混合するので、音声信号と変換音声信号とを互いに違和感なく切り替えることができる。

セレクタ９は、図１０のように音声信号と変換音声信号とを切り替える代わりに、音声信号と変換音声信号とを適応的に混合してもよい。この場合、セレクタ９は、相関度算出部５６で算出される相関度に応じて音声信号と変換音声信号とを混合するのがよい。セレクタ９は、相関度が高ければ、音声信号の重み付けを大きくして音声信号と変換音声信号とを混合し、相関度が低ければ、変換音声信号の重み付けを大きくして音声信号と変換音声信号とを混合する。

セレクタ９が相関度算出部５６で算出される相関度に応じて音声信号と変換音声信号とを混合するように構成されている場合、環境雑音分析部８を省略してもよい。相関度算出部５６が３段階以上の相関度を算出して、セレクタ９が音声信号と変換音声信号とを両者に対する重み付けを複数に可変させて混合してもよい。相関度算出部５６が算出する相関度は２段階であってもよく、任意の複数段階であればよい。

図１に戻り、Ｄ／Ａ変換器１０は、セレクタ９から供給された音声信号、音声信号と変換音声信号との混合音声信号、または変換音声信号をＤ／Ａ変換して、アナログの出力音声信号を生成する。以上のようにして収音装置１００が生成した出力音声信号は、外部のスピーカ、ヘッドフォン、音声記録装置等の任意の機器へと供給される。

以上のように、収音装置１００は、適応フィルタ６において変換音声信号に乗算する係数を、常時、短時間で残差信号が小さくなるように更新するのではなく、変換音声信号の品質を悪化させる可能性があるときには、長時間をかけて更新するか、更新しないように構成している。従って、収音装置１００によれば、振動センサ３が生成する振動信号に基づく音声信号（変換音声信号）の品質を特許文献１に記載の収音装置よりも向上させることができる。

また、収音装置１００は、セレクタ９によってＡ／Ｄ変換器２より出力された音声信号と適応フィルタ６より出力された変換音声信号とを選択して出力する。従って、収音装置１００によれば、マイクロフォン１が生成する音声信号と振動センサ３が生成する振動信号に基づく音声信号とを環境に応じて適切に選択することができる。

本発明は以上説明した本実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変更可能である。図１において、マイクロフォン１及び振動センサ３を除く部分が、マイクロコンピュータによって構成されていてもよい。この場合、収音装置１００は、非一時的な記憶媒体に記憶されたコンピュータプログラムがマイクロコンピュータの中央処理装置に上述した音声信号と変換音声信号との選択的な出力処理を実行させる。マイクロフォン１及び振動センサ３を除く部分がハードウェアで構成されて集積回路によって構成されていてもよい。

１マイクロフォン
２，４Ａ／Ｄ変換器
３振動センサ
５適応制御部
６適応フィルタ
７減算器
８環境雑音分析部
９セレクタ
１０Ｄ／Ａ変換器
１００収音装置

Claims

空気振動に基づく音声信号を生成するマイクロフォンと、
人体に伝わる振動に基づく振動信号を生成する振動センサと、
前記振動信号を前記音声信号に近付けるように補正するために、前記振動信号に係数を乗算して変換音声信号を生成する適応フィルタと、
前記音声信号と前記変換音声信号との差分である残差信号を生成する減算器と、
音声が存在する音声区間であると判定されるときには、前記適応フィルタが第１の速度で前記残差信号が小さくなるように前記係数を更新するよう制御し、音声が存在しない非音声区間であると判定されるときには、前記適応フィルタが前記第１の速度より遅い第２の速度で前記残差信号が小さくなるように前記係数を更新するよう制御するか、前記係数を更新しないように制御する適応フィルタ制御信号を生成して前記適応フィルタに供給する適応制御部と、
前記音声信号と前記変換音声信号とを選択するか両者を混合して出力するセレクタと、
を備える収音装置。
前記適応制御部は、
前記音声信号と前記振動信号との少なくとも一方に基づいて検出された音声区間であり、かつ前記音声信号と前記振動信号との音圧レベル比に基づく環境雑音レベルが第１の閾値以下であるという第１の条件を満たすとき、前記適応フィルタが前記第１の速度で前記係数を更新するよう制御する適応フィルタ制御信号を生成し、
前記第１の条件を満たさないとき、前記適応フィルタが前記第２の速度で前記係数を更新するよう制御するか、前記係数を更新しないように制御する適応フィルタ制御信号を生成する
請求項１に記載の収音装置。
前記適応制御部は、
前記音声信号と前記振動信号との少なくとも一方に基づいて検出された音声区間であり、かつ前記音声信号と前記変換音声信号との差分である残差信号を前記振動信号のレベルで正規化した残差相対レベルが第２の閾値以下であるという第２の条件を満たすとき、前記適応フィルタが前記第１の速度で前記係数を更新するよう制御する適応フィルタ制御信号を生成し、
前記第２の条件を満たさないとき、前記適応フィルタが前記第２の速度で前記係数を更新するよう制御するか、前記係数を更新しないように制御する適応フィルタ制御信号を生成する
請求項１に記載の収音装置。
前記非音声区間における前記音声信号と前記振動信号との音圧レベル比に基づく環境雑音レベルが第３の閾値以下であれば前記音声信号を選択し、前記第３の閾値を超えれば前記変換音声信号を選択するよう、前記セレクタを制御するセレクタ制御信号を生成して前記セレクタに供給する環境雑音分析部をさらに備える請求項１～３のいずれか１項に記載の収音装置。
前記適応制御部は、
前記音声信号と前記振動信号との少なくとも一方に基づいて音声区間を検出する音声区間検出部と、
前記音声信号と前記変換音声信号との差分である残差信号を前記振動信号のレベルで正規化した残差相対レベルを取得する残差相対レベル取得部と、
前記残差相対レベル取得部が取得した残差相対レベルに応じて、前記音声信号と前記振動信号との複数段階の相関度を算出する相関度算出部と、
を有し、
前記セレクタは、前記相関度算出部によって算出された相関度に応じて前記音声信号と前記変換音声信号とを適応的に混合して出力する
請求項１に記載の収音装置。