JP5034118B2 - 雑音除去装置、雑音除去方法及びコンピュータプログラム - Google Patents

雑音除去装置、雑音除去方法及びコンピュータプログラム Download PDF

Info

Publication number
JP5034118B2
JP5034118B2 JP2008139990A JP2008139990A JP5034118B2 JP 5034118 B2 JP5034118 B2 JP 5034118B2 JP 2008139990 A JP2008139990 A JP 2008139990A JP 2008139990 A JP2008139990 A JP 2008139990A JP 5034118 B2 JP5034118 B2 JP 5034118B2
Authority
JP
Japan
Prior art keywords
input
reference signal
switching
unit
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008139990A
Other languages
English (en)
Other versions
JP2009290483A (ja
Inventor
グンティダー ロットウィブンチャイ
和之 滝澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Casio Mobile Communications Ltd
Original Assignee
NEC Casio Mobile Communications Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Casio Mobile Communications Ltd filed Critical NEC Casio Mobile Communications Ltd
Priority to JP2008139990A priority Critical patent/JP5034118B2/ja
Publication of JP2009290483A publication Critical patent/JP2009290483A/ja
Application granted granted Critical
Publication of JP5034118B2 publication Critical patent/JP5034118B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、雑音除去装置、雑音除去方法及びコンピュータプログラムに関する。より詳しくは、雑音除去装置の雑音除去用信号の切り替えに関する。
複数のマイクを利用して取得した音から、周辺の雑音を除去し、目的とする音のみを復元する音源分離技術(例えば、非特許文献1参照)が存在する。この音源分離技術に、エコーキャンセラ(以後、「EC」という)機能を組み合わせることにより、テレビ会議やテレビ電話システムなどに利用することができる。
テレビ会議やテレビ電話システムなどで使用する情報処理装置は、一定期間に複数のマイクで取得した音の音声データを用いて音源分離処理を行い、音源分離処理後の音声を出力する。このようなテレビ電話システムでは、エコーキャンセラ機能を搭載するために、エコーと同じ音声をEC参照信号として入力する必要がある。
また、携帯端末でテレビ会議やテレビ電話システムを実現する際には、A−D変換器の数を増やさないために、複数のマイクからの音声入力チャネルの1つをEC参照信号入力用に切り替える構成にする場合がある。以下、EC参照信号入力用に切り替えられる音声入力チャネルを「EC参照信号入力チャネル」という。
戸上真人、天野明雄、新庄広、鴨志田亮太、"人間共生ロボットEMIEWの聴覚機能"人工知能学会、2005/10/14、pp.59-64
据え置き型のテレビ電話会議装置では、ユーザが利用している最中には、テレビ電話会議装置の形状を変更することはない。しかし、携帯端末に搭載するテレビ電話会議装置では、ユーザがテレビ電話を行っている最中に、携帯端末の形状を変更して利用する場合がある。例えば、端末を開いて手で持つスタイル(以後、「手持」という)から、端末を閉じて卓上に置くスタイル(以後、「卓上」という)に切り替える。携帯端末の利用形状が変更されると、携帯端末に搭載しているマイクの位置関係が変わるので、音源分離処理に利用するマイクを変更するためにEC参照信号入力チャネルを切り替える。
切り替えるタイミングによってエコーキャンセラ処理(以後、EC処理という)に使用する1つのフレーム(エコーキャンセラ処理1回分に利用する音声データ)の中に、マイク入力信号とEC参照信号入力の2種類の信号が混在するので、EC参照信号を取得できないフレームが発生する。EC参照信号を取得できないフレームでは、周辺の雑音やエコーを除去する処理が行えず、エコー除去性能が低下してしまう問題がある。
エコー除去性能が低下する例として図15に、制御部が行う音声入力取り込み処理と、音源分離部が行うEC処理及び音源分離処理のタイミングチャートを示す。制御部と、音源分離部とは、連続する2つのフレームを用いてEC処理及び音源分離処理を行い、1つのフレーム分遅らせて出力する。このフレーム長は、音源分離部の1回分の処理にかかる時間によって決定され、音源分離部は、1フレームの時間より短い時間でEC処理及び音源分離処理を行う、ここでは、Tミリ秒の音声データを1フレームとする。
制御部は、時刻t0から音声の取り込みを開始し、音声入力チャネルch0〜ch3から、2フレーム分のマイク入力信号Sig0〜Sig2とEC参照信号Refとを取得する。音源分離部は、制御部が2フレーム分の音声データの取得が終わる時点から、マイク入力信号Sig0〜Sig2とEC参照信号Refとを用いてEC処理及び音源分離処理を行う。図15では、音声取り込み開始時刻がt0なので、2フレーム目の音声データ取得が終わる時刻はt0+2Tになり、音源分離部は、時刻t0+2Tにおいて、1と2フレーム目のマイク入力信号Sig0〜Sig2とEC参照信号Refとを用いてEC処理及び音源分離処理を行う。音源分離部は、音源分離処理を行った結果のデータを記憶部に記憶する。音源分離部は、2フレーム目以降の音声データについても同様の処理を行う。制御部は、時刻t0+3Tにおいて、記憶された音源分離処理を行った結果の音声データを無線通信部を介して、通信相手に送信する。
時刻t1において携帯端末を「手持」から「卓上」に切り替えた場合には、端末利用状態が、「手持」から「卓上」に変化するため、EC参照信号入力用チャネルをch3からch0に変更する必要がある。3フレーム目の最中に携帯端末の形状を変更すると、ch0とch3の音声データはマイク入力音声とEC参照信号との2種類の信号が混在する。信号が混在したch0とch3の信号をEC参照信号として使用できないので、3フレーム目の処理ではEC参照信号を取得できない。EC参照信号がないので、EC処理でエコーを除去できず、エコー除去性能が低下する。処理後の出力音声の2フレーム目と3フレーム目は、入力音声の3フレーム目を利用して処理するので、出力音声のエコー除去性能が劣化する。
本発明は、上述のような問題を解決するためになされたもので、EC処理中に、EC参照信号入力チャネルを切り替える場合であっても、エコー除去性能の劣化を防止する雑音除去装置、雑音除去方法及びコンピュータプログラムを提供することを目的とする。
上記目的を達成するため、本発明の第1の観点に係る雑音除去装置は、
音を電気信号に変換する3つ以上の音入力手段と、
前記音入力手段で入力する前記電気信号のうち、目的とする音以外の雑音成分の少なくとも一部を含む雑音参照信号を入力する参照信号入力手段と、
前記電気信号と前記雑音参照信号のうち、2以上の前記電気信号と前記雑音参照信号を選択して入力する入力選択手段と、
所定の単位時間ごとに、前記入力選択手段で入力した前記電気信号から前記雑音参照信号の成分を除去する音源分離手段と、
前記入力選択手段で選択して入力する前記電気信号の組み合わせを切り替える切替手段と、
前記切替手段が前記入力選択手段で入力する前記電気信号の組み合わせを切り替えたときに、その切り替えた時刻を含む前記単位時間と、そののち所定の回数の前記単位時間が経過するまで、前記切替に関与した前記電気信号を前記音源分離手段の対象から除外する性能劣化防止手段と、
を備えることを特徴とする。
好ましくは、前記入力選択手段は、前記電気信号のいずれかと前記雑音参照信号とのいずれかを選択して入力するスイッチを複数備え、
前記切替手段は、前記入力選択手段で前記電気信号と前記雑音参照信号とを切り替える場合に、前記電気信号を入力していた第1の前記スイッチの入力を前記雑音参照信号に切り替える第1の切替を行ったのち、所定の回数の前記単位時間が経過してから、前記第1の切替の前に前記雑音参照信号を入力していた第2の前記スイッチの入力を前記電気信号を入力するように切り替える第2の切替を行い、
前記性能劣化防止手段は、前記音源分離手段に、前記第1の切替の時刻を含む前記単位時間では前記第2のスイッチで入力する前記雑音参照信号を用い、前記第2の切替の時刻を含む前記単位時間では前記第1のスイッチで入力する前記雑音参照信号を用いて、入力した前記電気信号から前記雑音参照信号の成分を除去させる、
ことを特徴とする。
さらに好ましくは、前記音源分離手段は、連続する2以上の前記単位時間の前記電気信号及び前記雑音参照信号を用いて、1つの前記単位時間の前記電気信号について前記雑音参照信号の成分を除去する処理を行い、
前記第1の切替と第2の切替の間で経過する前記単位時間の所定の回数は、前記音源分離手段で用いる前記電気信号及び前記雑音参照信号の連続する単位時間の個数以上であって、
前記性能劣化防止手段は、全ての前記単位時間について、前記音源分離手段が用いる連続する2以上の前記単位時間の前記電気信号及び前記雑音参照信号が、それぞれいずれも同じスイッチを経由した信号となるように、前記音源分離手段で用いる前記電気信号及び前記雑音参照信号を選択する、
ことを特徴とする。
より好ましくは、前記雑音除去装置は、その形状を変更して利用可能であって、
前記切替手段は、前記雑音除去装置の形状が変化した場合に、前記入力選択手段で選択して入力する前記電気信号の組み合わせを切り替える、
ことを特徴とする。
さらに好ましくは、前記性能劣化防止手段は、前記入力選択手段で選択する前記電気信号と前記雑音参照信号の組み合わせの情報と、前記切替手段が前記入力選択手段で入力する前記電気信号の組み合わせを切り替えたことを表す情報とを記憶する制御情報記憶手段を備え、
前記音源分離手段は、前記入力選択手段で選択する前記電気信号と前記雑音参照信号の組み合わせの情報と、前記切替手段が前記入力選択手段で入力する前記電気信号の組み合わせを切り替えたことを表す情報に基づいて、前記入力選択手段で入力した前記電気信号から前記雑音参照信号の成分を除去する処理の対象を判別する、
ことを特徴とする。
本発明の第2の観点に係る雑音除去方法は、
音を入力して3つ以上の電気信号に変換する音入力ステップと、
前記音入力ステップで入力する前記電気信号のうち、目的とする音以外の雑音成分の少なくとも一部を含む雑音参照信号を入力する参照信号入力ステップと、
前記電気信号と前記雑音参照信号のうち、2以上の前記電気信号と前記雑音参照信号を選択して入力する入力選択ステップと、
所定の単位時間ごとに、前記入力選択ステップで入力した前記電気信号から前記雑音参照信号の成分を除去する音源分離ステップと、
前記入力選択ステップで選択して入力する前記電気信号の組み合わせを切り替える切替ステップと、
前記切替ステップで、前記入力選択ステップで選択して入力する前記電気信号の組み合わせを切り替えたときに、その切り替えた時刻を含む前記単位時間と、そののち所定の回数の前記単位時間が経過するまで、前記切替に関与した前記電気信号を前記音源分離ステップの対象から除外する性能劣化防止ステップと、
を備えることを特徴とする。
本発明の第3の観点に係るコンピュータプログラムは、
コンピュータに、
音を入力して3つ以上の電気信号に変換する音入力ステップと、
前記音入力ステップで入力する前記電気信号のうち、目的とする音以外の雑音成分の少なくとも一部を含む雑音参照信号を入力する参照信号入力ステップと、
前記電気信号と前記雑音参照信号のうち、2以上の前記電気信号と前記雑音参照信号を選択して入力する入力選択ステップと、
所定の単位時間ごとに、前記入力選択ステップで入力した前記電気信号から前記雑音参照信号の成分を除去する音源分離ステップと、
前記入力選択ステップで選択して入力する前記電気信号の組み合わせを切り替える切替ステップと、
前記切替ステップで、前記入力選択ステップで選択して入力する前記電気信号の組み合わせを切り替えたときに、その切り替えた時刻を含む前記単位時間と、そののち所定の回数の前記単位時間が経過するまで、前記切替に関与した前記電気信号を前記音源分離ステップの対象から除外する性能劣化防止ステップと、
を実行させることを特徴とする。
本発明によれば、雑音除去処理中に、雑音除去参照信号入力チャネルを切り替える場合であっても、雑音除去性能の劣化を防止することができる。
以下、本発明の実施の形態について図面を参照しながら詳細に説明する。なお、図中同一又は相当部分には同一符号を付し、その説明は繰り返さない。実施形態に係わる雑音処理装置を備える携帯端末20を例にして説明する。なお、本発明は携帯端末に限定されるものではなく、デジタルビデオカメラやノートパソコンなどの該装置の形態を変更して利用できる装置でも同様の制御が可能である。
図1は、本発明の実施の形態に係る雑音処理装置を備える携帯端末20の構成を示すブロック図である。携帯端末20は、無線通信部10と、制御部11と、音声入力部12と、音声出力部13と、記憶部14と、操作部15と、撮像部16と、表示部17と、利用状態検出部18と、バス19と、スピーカ24とを備え、バス19は各部を接続する。制御部11は、音源分離部111と、性能劣化防止部112とを備える。音声入力部12は、マイク120〜123と、A−D変換器124と、スイッチ(以下、SWという)1、2とを備える。
図2は、本発明の実施の形態に係る雑音処理装置の構成を示すブロック図である。雑音処理装置は、音声出力部13と、利用状態検出部18と、音源分離部111と、性能劣化防止部112と、マイク120〜123と、SW1、SW2と、バッファとを備える。
図3は、端末利用状態が「手持」の場合の携帯端末の外観を示す図である。図3の左は操作部側から視た図であり、右はその背面側から視た図である。図4は、端末利用状態が「卓上」の場合の携帯端末の外観を示す図である。図4の上は画面側から視た図であり、下はその背面側から視た図である。携帯端末20は、テレビ電話機能を備える携帯電話装置であり、画面を備える筐体を回転して折り畳むことで形状を変更することができる。携帯端末20は、表示部17などを実装する上側筐体21と、操作部などを実装する下側筐体22とに分かれており、上側筐体21と下側筐体22とはヒンジ部23で接続する。携帯端末20の外観には、音声出力部13に繋がるスピーカ24と、音声入力部12に含まれる複数のマイク120〜123と、画面と、操作部15などを備える。
図3に示す携帯端末20を開いた状態では、ユーザが手に持ってテレビ電話をすることが考えられ、以下この利用状態を「手持」という。「手持」状態で画面を正面から見るユーザからのマイクの配置状態は、マイク120はユーザの正面に位置し、マイク121はマイク120から横方向に水平移動した右側に位置し、マイク122はマイク121の裏に位置し、マイク123はマイク120から縦方向に移動した上側筐体21の左側に位置する。「手持」状態で携帯端末20を用いてテレビ電話を行う場合に、最良の雑音除去性能を得るために、音声入力に使用するマイクをマイク120〜122とし、残りのマイク123に対応するA−D変換器124の入力チャネルをEC参照信号入力用にして使用する。
同様に図4に示す携帯端末20を閉じた状態では、ユーザが机の上に置いてテレビ電話をすることが考えられ、以下この利用状態を「卓上」という。「卓上」状態で画面を正面から見るユーザからのマイクの配置状態は、マイク123はユーザの正面に位置し、マイク121はマイク123と同じ高さの下側筐体22の上側に位置し、マイク122はマイク121の裏に位置し、マイク120はマイク121から縦方向に移動した下側筐体22の下側に位置する。「卓上」状態で携帯端末20を用いてテレビ電話を行う場合に、最良の雑音除去を得るために、音声入力に使用するマイクをマイク121〜123とし、残りのマイク120に対応するA−D変換器124の入力チャネルをEC参照信号入力に使用する。
実施の形態では、携帯端末20の利用状態を「手持」から「卓上」に切り替えたり、「卓上」から「手持」に切り替えたりして端末利用状態が変化する場合を「形状切替中」という。
スピーカ24は、携帯端末20が受信した音声信号などを音に変換して出力する。複数のマイク120〜123は、各マイクが集音した音の音声レベルに応じた音声信号を出力する。音源分離部111は、各マイクが出力する音声信号をエコー除去と雑音除去のために用いる。なお、実施の形態では、マイクを4個用いて音源分離処理に利用する場合について説明するが、マイク数を4個に限定するものではなく、本実施の形態ではマイク入力信号用に1個以上、切替前後でEC参照信号と切り替えるための2個以上の計3個以上のマイクが有ればよく、マイクの数に制限はない。
無線通信部10は、通話音声や撮像画像などを基地局を介して通信相手に送信する。また、無線通信部10は、基地局を介して音声データや画像データを通信相手から受信する。
制御部11は、CPU(Central Processing Unit)などで構成し、記憶部14が記憶する動作プログラムに従って携帯端末20全体を制御する。また、制御部11は、音源分離部111と、性能劣化防止部112と、を備える。また、制御部11は、プログラムの命令又は、性能劣化防止部112からの信号などにより、SW1、SW2を制御する。
音源分離部111は、制御部11から処理開始の指示を受け、動作モード情報141に応じたEC処理を実施した後に、音源分離処理を行う。音源分離部111の音源分離処理では、音声入力部12が備える複数のマイク120〜123が入力した音を処理し、予め設定する特定方位の領域から到来した音のみを分離抽出する。
性能劣化防止部112は、利用状態検出部18から変化通知信号を受け、変化通知信号の種類に応じて音声入力部12のSW1、SW2の音声入力を切り替えて、EC参照信号を継続的に取得できるように音源分離部111の動作を制御する。
音声入力部12は、複数のマイク120〜123と、各マイク120〜123が出力したアナログの音声信号をデジタル信号に変換するA−D変換器124と、入力信号の切替を行うSW1、SW2とを備える。4個のマイク数に対応して、A−D変換器124には4チャンネルの入力チャネル数があり、マイク120、マイク121、マイク122、マイク123、の出力をA−D変換器124のチャネルch0、ch1、ch2、ch3、の入力に接続する。
携帯端末20の利用状態が「手持」の場合はマイク120〜122の音声入力Sig0〜Sig2を音源分離処理に使用し、マイク123に対応するチャネルch3をEC参照信号入力に使用する。また、携帯端末20の利用状態が「卓上」の場合はマイク121〜123の音声入力Sig1〜Sig3を音源分離処理に使用し、マイク120に対応するチャネルch0をEC参照信号入力に使用する。音声入力部12は、2個のスイッチを備え、SW2がマイク120出力Sig0とEC参照信号Refとを切り替え、SW1がマイク123出力Sig3とEC参照信号Refとを切り替える。SW1とSW2の動作は、制御部11が制御する。また、A−D変換器124のch0〜ch3の出力信号は、記憶部14に格納し、音源分離部111が使用する。
音声出力部13は、制御部11によって制御され、無線通信部10が受信する音声データを変換し、アンプで増幅してから、スピーカ24やレシーバから音を出力する。また、音声出力部13は、音声入力部12にEC参照信号Refを供給する。
記憶部14は、制御部11のプログラムと、音声処理用の音声データと、動作モード情報141と、システム設定情報142などを記憶する。例えば、記憶部14は、制御部11に実行させるための制御プログラムと、テレビ電話アプリケーションプログラムと、音源分離部111が使用する音声データなどを記憶する。なお、記憶部14は、内蔵メモリ又は外部メモリのいずれで構成してもよい。
動作モード情報141は、音源分離部111の動作モードを表す情報である。制御部11又は制御部11の性能劣化防止部112が、音源分離部111を制御するために動作モード情報141に各項目の状態を設定する。図5に示すように、動作モード情報141の内容には、端末利用状態と、音源分離用チャネルと、EC参照信号用チャネルと、切替中の処理回数と、次の端末利用状態との項目を含む。
「端末利用状態」は、携帯端末20の利用状態が現在どの状態であるかを示す。携帯端末20が、現在ユーザによって「手持」状態、「卓上」状態、「形状切替中」状態のうちのどの状態で利用しているのかを示す。
「音源分離用チャネル」は、携帯端末20の「端末利用状態」に対応する音源分離処理用の入力音声チャネルを示す。「端末利用状態」が「手持」の場合には、音声入力チャネル「ch0〜ch2」を使用して音源分離処理する。「端末利用状態」が「卓上」の場合には、音声入力チャネル「ch1〜ch3」を使用して音源分離処理する。「端末利用状態」が「形状切替中」の場合には、音声入力チャネル「ch1、ch2」を使用して音源分離処理する。
「EC参照信号用チャネル」は、携帯端末20の「端末利用状態」に対応するEC参照信号用の入力音声チャネルを示す。「端末利用状態」が「手持」の場合には、音声入力チャネル「ch3」をEC参照信号Refとして使用してEC処理をする。「端末利用状態」が「卓上」の場合には、音声入力チャネル「ch0」をEC参照信号Refとして使用してEC処理をする。「端末利用状態」が「形状切替中」の場合には、タイミングによって音声入力チャネル「ch0」又は「ch3」をEC参照信号Refとして使用してEC処理をする。
「切替中の処理回数」は、「端末利用状態」が「形状切替中」の場合に性能劣化防止部112が使用する情報であり、「形状切替中」に音源分離部111が行う処理回数を示す。「切替中の処理回数」情報は、性能劣化防止部112で使用し、「形状切替中」の音源分離処理をする回数の情報で、「0〜4」まで使用する。「切替中の処理回数」の情報に基づいて、性能劣化防止部112は、「ch0」と「ch3」との一方をEC参照信号Refとして使用することを決めて、動作モード情報141のEC参照信号用チャネルの情報を更新する。「ch0」を使用する場合は、動作モード情報141のEC参照信号用チャネルに「ch0」を設定する。「ch3」を使用する場合は、動作モード情報141のEC参照信号用チャネルに「ch3」を設定する。
「次の端末利用状態」は、「形状切替中」を終了した後の端末利用状態を示す。「形状切替中」の処理を終了した際に、性能劣化防止部112が動作モード情報141の「端末利用状態」を「形状切替中」から「次の端末利用状態」に記載の状態に変更する。
システム設定情報142は、各端末利用状態の設定情報である。システム設定情報142には、各端末利用状態の場合に、音源分離処理の対象として使用する音声入力チャネルと、EC参照信号入力用として使用する音声入力チャネルと、SW1、SW2を制御する設定状態を示す情報があり、予め記憶部14に設定する。図6に示すように、システム設定情報142の内容には、端末利用状態と、音源分離用チャネルと、EC参照信号用チャネルと、スイッチ設定の項目を含む。
システム設定情報142の「端末利用状態」の項目と「音源分離用チャネル」の項目とは、動作モード情報141の各項目と同様のため説明を省略する。また、「EC参照信号用チャネル」も動作モード情報141と基本的には同様の情報である。但し、端末利用状態が「形状切替中」の場合は切替前の端末利用状態と、切替後の端末利用状態とに依存して状態が変わるため、システム設定情報142の「EC参照信号用チャネル」の項目には記載しない。
「スイッチ設定」は、各端末利用状態での、SW1、SW2を制御する設定状態を示す情報がある。端末利用状態が「手持」の場合には、SW1の入力がEC参照信号Refを選択し、SW2の入力がマイク120の出力信号Sig0を選択する。端末利用状態が「卓上」の場合には、SW1の入力がマイク123の出力信号Sig3を選択し、SW2の入力がEC参照信号Refを選択する。端末利用状態が「形状切替中」の場合には、切替前の端末利用状態と切替後の端末利用状態によって変わるため、システム設定情報142のスイッチ設定に記載しない。
操作部15は、キーボードやボタンなどで構成し、電話番号や文字情報や画面上のカーソルの位置情報など情報もしくは指示を入力し、制御部11に伝える。
撮像部16は、カメラなどで構成し、操作部15の操作により、被写体の画像を撮像し、記憶部14に保存したり、表示部17に撮影画像を表示する。
表示部17は、LCD(Liquid Crystal Display)や、有機EL(Organic Electro-Luminescence)などの画面とLCDや有機ELを駆動するドライバ回路などで構成する。例えば、無線通信部10から取得したテレビ電話の通信相手の画像などを表示する。
利用状態検出部18は、携帯端末20の利用状態を検知する。利用状態検出部18は、携帯端末20の利用状態が「手持」か「卓上」か「形状切替中」かなどの利用状態であるのかを検出し、検出結果を制御部11に伝える。端末利用状態を判断する方法としては、例えば、携帯端末20が備えるヒンジ部23のセンサ(図示せず)などを使って、端末が開いているのか閉じているのかなどに基づいて「手持」か「卓上」かなどの端末の利用状態を判断する。
また、利用状態検出部18は、携帯端末20の利用状態の変化を検出する手段を備え、「形状切替中」(利用状態が変化したこと)を検出した際には、その情報を制御部11の性能劣化防止部112に伝える。「形状切替中」の状態として、入力音声データが、マイクの出力音声からEC参照信号入力用に変わる場合と、EC参照信号入力用からマイクの出力信号に変わる場合との2通りと考えられる。
端末利用状態が「手持」から「卓上」に変化する場合を変化パターン1とし、端末利用状態が「卓上」から「手持」に変化する場合を変化パターン2とする。各変化が発生する際に、利用状態検出部18が性能劣化防止部112に変化通知信号を送る。変化パターン1が発生した際には、性能劣化防止部112に卓上状態信号を送り、変化パターン2が発生した際には、性能劣化防止部112に手持状態信号を送る。なお、変化パターンは、2通りに限定する必要はない。
バス19は、各部間でデータを伝送し、無線通信部10と、制御部11と、音声入力部12と、音声出力部13と、記憶部14と、操作部15と、撮像部16と、表示部17と、利用状態検出部18と、スピーカ24とを接続する。
図7は、ユーザがテレビ電話の開始を指示した場合に、制御部11が実行するテレビ電話処理を示すフローチャートであり、エコー除去性能劣化を改善するための動作を説明する。ユーザが操作部15を操作してテレビ電話の開始を指示すると、操作部15は、この操作情報を制御部11に送る。制御部11は、操作部15から送られた操作情報に基づいて記憶部14からテレビ電話処理のプログラムデータを読み出し、図7に示すフローチャートに従い、このテレビ電話処理を実行する。
制御部11は、利用状態検出部18に、携帯端末20の現在の利用状態を検出するように依頼を送信する(ステップS101)。
利用状態検出部18は、制御部11からの利用状態検出の依頼を受信すると、図8に示すフローチャートに従い、利用状態検出処理を実行する。利用状態検出部18は、ヒンジ部23に設けたセンサなどからのセンサ信号に基づいて携帯端末20の端末利用状態を検出する(ステップS201)。利用状態検出部18は、動作モード情報141の端末利用状態の欄に、検出した端末利用状態の情報「手持」又は「卓上」の情報を記録する(ステップS202)。システム設定情報142を参照して、検出した端末利用状態の音源分離用チャネルの情報を動作モード情報141の音源分離用チャネルの欄に設定し、検出した端末利用状態のEC参照信号用チャネルの情報を動作モード情報141のEC参照信号用チャネルに設定する。利用状態検出部18は、制御部11に利用状態検出終了を通知し(ステップS203)、この利用状態検出処理を終了させる。
制御部11は、利用状態検出部18から利用状態検出終了の通知を受け取ると(ステップS102)、動作モード情報141の端末利用状態の欄を参照して端末利用状態が「手持」であるか否かを判別する(ステップS103)。
端末利用状態が「手持」であると判別した場合には(ステップS103;YES)、制御部11は、システム設定情報142を参照してスイッチを「手持」状態に設定する。制御部11は、SW1を制御してEC参照信号Refを選択し、SW2を制御して音声信号Sig0を選択する(ステップS104)。
端末利用状態が「手持」ではないと判別した場合には(ステップS103;NO)、制御部11は、システム設定情報142を参照してスイッチを「卓上」状態に設定する。制御部11は、SW1を制御して音声信号Sig3を選択し、SW2を制御してEC参照信号Refを選択する(ステップS105)。
制御部11は、各スイッチの制御が完了すると、音処理を実行する(ステップS106)。図9は、図7のステップS106の音処理を示すフローチャートである。1フレーム毎に、音取得処理、EC処理及び音源分離処理を実施し、利用状態が切替中の場合には、性能劣化防止処理を実施する。制御部11は、音声入力部12から1フレーム分の音声データを取得して、音源分離部111に音声取得完了を通知する(ステップS301)。なお、音源分離部111が受け取るフレームが通話開始後の1番目のフレームの場合には、音源分離処理に必要な2フレーム分の入力音声データが揃っていないので、EC処理及び音源分離処理は実施しない(フローチャートに図示せず)。
制御部11は、動作モード情報141の端末利用状態の欄を参照して、動作モード情報141の端末利用状態が「形状切替中」であるか否かを判別する(ステップS302)。制御部11は、動作モード情報141の端末利用状態を「形状切替中」ではないと判別した場合には(ステップS302;NO)、さらに、端末利用状態が「手持」かを判断する(ステップS303)。
音源分離部111は、動作モード情報141のEC参照信号用チャネルの欄と音源分離用チャネルの欄を参照して、EC処理を行う。端末利用状態が「手持」の場合には(ステップS303;YES)、音源分離部111は、音声入力チャネルch3の信号をEC参照信号Refとして使用し、音声入力チャネルch0〜ch2の信号に対してEC処理を行い(ステップS305)、EC処理後のch0〜ch2の信号を使って音源分離処理を行う(ステップS306)。
端末利用状態が「卓上」の場合には(ステップS303;NO)、音源分離部111は、音声入力チャネルch0の信号をEC参照信号Refとして使用し、音声入力チャネルch1〜ch3の信号に対してEC処理を行い(ステップS304)、EC処理後のch1〜ch3の信号を使って音源分離処理を行う(ステップS306)。音源分離部111は、各端末利用状態での音源分離処理が終わると(ステップS306)、音源分離処理結果のデータを記憶部14に記憶して(ステップS307)、処理を終了する。無線通信部10は、次のフレーム開始時に、記憶部14が記憶したデータを出力として送信する。
動作モード情報141の端末利用状態が「形状切替中」の場合には(ステップS302;YES)、音源分離部111は、動作モード情報141の設定値に基づいて、音声入力チャネルch1、ch2の信号に対してEC処理を行い(ステップS308)、EC処理後のch1、ch2の信号を使って音源分離処理を行う(ステップS309)。音源分離部111は、各端末利用状態での音源分離処理が終わると(ステップS309)、音源分離処理結果のデータを記憶部14に記憶(ステップS310)する。ここまでの処理は、端末利用状態が切替中でない場合の(ステップS302;NO)、ステップS304乃至ステップS307の処理と基本的には同じである。
1フレーム分の音処理が終わると、性能劣化防止部112は、SW1、SW2の切替と、動作モード情報141の設定値を更新する性能劣化防止処理(ステップS311、図10の処理)を行う。なお、利用状態が変化したときに性能劣化防止部112が行う設定処理は、フレーム単位の処理とは非同期に行うので、別途、利用状態切替時処理のフローチャートに示す(図11)。ここでは、設定処理により、音源分離処理用チャネル「ch1、ch2」、処理回数の欄の値「0」に設定し、EC参照信号用チャネルは、利用状態が変化する前の状態に従って、「ch0」又は「ch3」に設定しているとする。また、SW1およびSW2はともにEC参照信号を選択するように設定され、切替中の処理回数(n)は0にリセットされる。
性能劣化防止部112は、動作モード情報141の切替中の処理回数(n)に1を加算し、加算結果を切替中の処理回数の欄に記録する(ステップS401)。切替中の処理回数の欄の値を判別する(ステップS402)。形状変化後の1回目の処理では、切替中の処理回数の欄の値が「1」なので(ステップS402;1)、性能劣化防止部112は、初期設定された動作モード情報141の値をそのまま維持し、SW1、SW2の状態もそのまま維持する。すなわち、SW1およびSW2はともにEC参照信号を選択したままである。
切替中の処理回数の欄の値が「2」である場合には(ステップS402;2)、性能劣化防止部112は、動作モード情報141の次の端末利用状態の欄に記載の情報を参照して、スイッチ制御を行う(ステップS403)。なお、動作モード情報141の次の端末利用状態は、端末の利用状態が切り替わった後の状態を記憶する。次の端末利用状態が「手持」の場合には、性能劣化防止部112は、システム設定情報142のスイッチ設定の欄に「SW1=Ref、SW2=sig0」を記録し、SW1を制御してEC参照信号Refに切り替え、SW2を制御してマイク入力信号Sig0に切り替える。次の端末利用状態が「卓上」の場合には、性能劣化防止部112は、システム設定情報142のスイッチ設定の欄に「SW1=Sig3、SW2=Ref」を記録し、SW1を制御してマイク入力信号Sig3に切り替え、SW2を制御してEC参照信号Refに切り替える。
性能劣化防止部112は、動作モード情報141の次の端末利用状態の欄に記載する状態を参照して、システム設定情報142から対応するEC参照信号用チャネルの情報を取得して記録する(ステップS404)。次の端末利用状態が「手持」の場合には、EC参照信号用チャネルの欄に「ch3」を記録し、次の端末利用状態が「卓上」の場合には、EC参照信号用チャネルの欄に「ch0」を記録する。
切替中の処理回数の欄の値が「3」の場合には(ステップS402;3)、性能劣化防止部112は、初期設定された動作モード情報141の値をそのまま維持し、SW1、SW2の状態もそのまま維持する。したがって、次の端末利用状態が「手持」の場合には、スイッチ設定は「SW1=Ref、SW2=sig0」であり、次の端末利用状態が「卓上」の場合には、スイッチ設定は「SW1=Sig3、SW2=Ref」である。
切替中の処理回数の欄の値が「4」である場合には(ステップS402;4)、性能劣化防止部112は、動作モード情報141の次の端末利用状態の欄と、システム設定情報142とを参照して、動作モード情報141を更新する(ステップS405)。次の端末利用状態が「手持」の場合には、端末利用状態の欄には「手持」、音源分離用チャネルの欄には「ch0〜ch2」、EC参照信号用チャネルの欄には「ch3」、を記録して、処理を終了する。次の端末利用状態が「卓上」の場合には、端末利用状態の欄には「卓上」、音源分離用チャネルの欄には「ch1〜ch3」、EC参照信号用チャネルの欄には「ch0」、を記録する。切替中の処理回数の欄の値をリセットする(ステップS406)。
図11は、形態端末20の利用状態が変化したときに、性能劣化防止部112が実行する利用状態切替時の設定処理のフローチャートである。利用状態検出部18は、携帯端末20の形状が変化する際にヒンジ部23からのセンサ信号を受信すると、手持状態信号又は卓上状態信号を性能劣化防止部112に伝える。性能劣化防止部112は、利用状態検出部18からの手持状態信号又は卓上状態信号に基づき、音源分離処理や性能劣化防止処理などのフレーム単位の処理とは非同期に利用状態切替時の設定処理を行う。
性能劣化防止部112は、利用状態検出部18から利用状態が変更した信号を受信し(ステップS501)、受信信号の状態が手持状態信号かを判断する(ステップS502)。
受信信号が手持状態信号(変化パターン2)の場合には(ステップS502;YES)、「卓上」状態から「手持」状態に変化した場合であり、性能劣化防止部112は、SW1を制御して、ch3をEC参照信号Refに切り替える(ステップS503)。なお、SW2が現状を維持しているので、ch0とch3とは、EC参照信号Refを入力する。性能劣化防止部112は、動作モード情報141に次の端末利用状態の欄に「手持」を記録し、EC参照信号用チャネルの欄には変更前の端末利用状態「卓上」の「ch0」を記録する(ステップS504)。
受信信号が卓上状態信号(変化パターン1)の場合には(ステップS502;NO)、性能劣化防止部112は、SW2を制御して、ch0をEC参照信号Refに切り替える(ステップS505)。なお、SW1が現状を維持しているので、ch0とch3とは、EC参照信号Refを入力する。「手持」状態から「卓上」状態に変化した場合であり、性能劣化防止部112は、動作モード情報141に次の端末利用状態の欄に「卓上」を記録し、EC参照信号用チャネルの欄には変更前の端末利用状態「手持」の「ch3」を記録する(ステップS506)。
性能劣化防止部112は、動作モード情報141の端末利用状態の欄に「形状切替中」を記録し(ステップS507)、動作モード情報141の切替中の処理回数の欄に「0」を記録し(ステップS508)、動作モード情報141の音源分離用チャネルの欄に「ch1、ch2」を記録する(ステップS509)。次のフレーム処理のタイミングから切替中の処理を実施するための設定をする。
図12、図13に示すタイミングチャートを用いて制御部11、音源分離処理部111、性能劣化防止部112が行う処理を説明する。図12は、ユーザがテレビ電話利用中に端末利用スタイルを「手持」から「卓上」に切り替える時のタイミングチャートである。
制御部11は、時刻t0において、音声の取り込みを開始すると、音声入力チャネルch0〜ch2からマイク入力信号Sig0〜Sig2を、音声入力チャネルch3からEC参照信号Refを取得する。1フレーム分の音声データの取得が終わる時点で音声取得完了を通知する(図9ステップS301)。音源分離処理部111は、動作モード情報141に記載の情報に基づいてEC処理及び音源分離処理を行う。なお、制御部11は、周期T毎に音声取得完了の通知を受け取り、動作モード情報141に記載の情報に基づいて動作する(図9)。
時刻t1において、ユーザが端末利用スタイルを手持から卓上に切り替えるので、利用状態検出部18が「卓上状態信号」を性能劣化防止部112に送信する。性能劣化防止部112は、SW2をEC参照信号Refに切り替えるように制御する。性能劣化防止部112は、動作モード情報141の端末利用状態の欄に「形状切替中」を、音源分離用チャネルの欄に「ch1、ch2」を、EC参照信号用チャネルの欄には「ch3」を、切替中の処理回数の欄に「0」を、次の端末利用状態の欄には「卓上」、を記録する(図11)。
t0+3Tにおいて、音源分離処理部111は、動作モード情報141の情報に基づいて、ch3の入力をEC参照信号用として使用し、ch1、ch2のマイク入力信号をEC処理して(図9ステップS308)、EC処理後のch1、ch2の音声データを使用して音源分離処理を行い(ステップS309)、処理結果を記憶する(ステップS310)。性能劣化防止部112は、切替中の処理回数(n)に1を加算して、動作モード情報141の切替中の処理回数の欄に「1」を記録して(図10ステップS401)、処理を終了する。
時刻t0+4Tにおいて、音源分離部111の処理は、時刻t0+3Tと同様の処理を行う(図9ステップS308〜ステップS310)。性能劣化防止部112は、切替中の処理回数に1を加算して、動作モード情報141の切替中の処理回数の欄に「2」を記録する(図10ステップS401)。動作モード情報141の次の端末利用状態は「卓上」なので、SW1をマイク入力信号Sig3に切り替える制御をして(ステップS403)、動作モード情報141のEC参照信号用チャネルの欄に「ch0」を記録して(ステップS404)、処理を終了する。
時刻t0+5Tにおいて、音源分離処理部111は、ch0の入力をEC参照信号用として使用し、ch1、ch2のマイク入力信号をEC処理して(図9ステップS308)、EC処理後のch1、ch2の音声データを使用して音源分離処理を行い(ステップS309)、処理結果を記憶する(ステップS310)。性能劣化防止部112は、切替中の処理回数(n)に1を加算して、動作モード情報141の切替中の処理回数の欄に「3」を記録し(図10ステップS401)、処理を終了する。
時刻t0+6Tにおいて、音源分離処理部111は、時刻t0+5Tと同様の処理を行う(図9ステップS308〜ステップS310)。切替中の処理回数(n)に1を加算した(図10ステップS401)結果が「4」なので(ステップS402;4)、性能劣化防止部112は、動作モード情報141の設定を行う。動作モード情報141の次の端末利用状態は「卓上」なので、動作モード情報141の端末利用状態の欄には「卓上」、音源分離用チャネルの欄には「ch1〜ch3」、EC参照信号用チャネルの欄には「ch0」、を記録する(ステップS405)。切替中の処理回数をリセットする(ステップS406)。
時刻t0+7T以降では、「ch0」の入力をEC参照信号用として使用し、「ch1〜ch3」の音声信号を使用して音源分離処理を行う。
図13は、ユーザがテレビ電話利用中に端末利用スタイルを「卓上」から「手持」に切り替える時のタイミングチャートである。制御部11は、時刻t0において、音声の取り込みを開始すると、音声入力チャネルch1〜ch3からマイク入力信号Sig1〜Sig3を、音声入力チャネルch0からEC参照信号Refを取得する。1フレーム分の音声データの取得が終わる時点で音声取得完了を通知する(図9ステップS301)。音源分離処理部111は、動作モード情報141に記載の情報に基づいてEC処理及び音源分離処理を行う(図9)。
時刻t1において、ユーザが端末利用スタイルを卓上から手持に切り替えるので、利用状態検出部18が「手持状態信号」を性能劣化防止部112に送信する。性能劣化防止部112は、SW1をEC参照信号Refに切り替えるように制御する。性能劣化防止部112は、動作モード情報141の端末利用状態の欄に「形状切替中」を、切替中の処理回数の欄に「0」を、音源分離用チャネルの欄に「ch1、ch2」を記録する(図11)。
t0+3Tにおいて、音源分離処理部111は、動作モード情報141の情報に基づいて、ch0の入力をEC参照信号用として使用し、ch1、ch2のマイク入力信号をEC処理して(図9ステップS308)、EC処理後のch1、ch2の音声データを使用して音源分離処理を行い(ステップS309)、処理結果を記憶する(ステップS310)。性能劣化防止部112は、切替中の処理回数(n)を1で加算して、動作モード情報141の切替中の処理回数の欄に「1」を記録して(図10ステップS401)、処理を終了する。
時刻t0+4Tにおいて、音源分離処理部111は、時刻t0+3Tと同様の処理を行う(図9ステップS308〜ステップS310)。性能劣化防止部112は、切替中の処理回数(n)に1を加算して、動作モード情報141の切替中の処理回数の欄に「2」を記録する(図10ステップS401)。動作モード情報141の次の端末利用状態は「手持」なので、SW2を マイク入力信号Sig0に切り替えるように制御し(ステップS403)、動作モード情報141のEC参照信号用チャネルの欄に「ch3」を記録し(ステップS404)、処理を終了する。
時刻t0+5Tにおいて、音源分離処理部111は、ch3の入力をEC参照信号用として使用し、ch1、ch2のマイク入力信号をEC処理して(図9ステップS308)、EC処理後のch1、ch2の音声データを使用して音源分離処理を行い(ステップS309)、処理結果を記憶する(ステップS310)。性能劣化防止部112は、切替中の処理回数(n)に1を加算して、動作モード情報141の切替中の処理回数の欄に「3」を記録し(図10ステップS401)、処理を終了する。
時刻t0+6Tにおいて、音源分離処理部111は、時刻t0+5Tと同様の処理を行う(図9ステップS308〜ステップS310)。切替中の処理回数(n)に1を加算した(図10ステップS401)結果が「4」なので(ステップS402;4)なので、性能劣化防止部112は、動作モード情報141の設定を行う。動作モード情報141の次の端末利用状態は「手持」なので、動作モード情報141の端末利用状態の欄には「手持」、音源分離用チャネルの欄には「ch0〜ch2」、EC参照信号用チャネルの欄には「ch3」、を記録する(ステップS405)。切替中の処理回数をリセットする(ステップS406)。
時刻t0+7T以降では、「ch3」の入力をEC参照信号用として使用し、「ch0〜ch2」の音声信号を使用して音源分離処理を行う。
以上説明したように、実施の形態に係る雑音処理装置を備える携帯端末20によれば、携帯端末20の形状を変化させて利用する場合でも、各利用状態に対応させて音源分離用に使用する音声入力チャネルと雑音除去用に使用するEC参照信号入力チャネルとを切り替えて使用するので、各形状の利用状態での最良の音質を得ることができる。また、携帯端末20は、EC処理中に、携帯端末の利用状態が変化したことを検出すると、一時的に2つの音声入力チャネルをEC参照信号入力チャネルにすることによって、EC参照信号入力チャネルを確実に確保することができる。利用状態変更に伴ってEC参照信号入力チャネルを切り替える途中の状態でも継続的にEC参照信号を取得することができるので、途切れることなく雑音やエコーを除去でき、雑音除去処理やエコー除去処理の性能劣化を防止できる。
なお、実施の形態ではエコーキャンセラの処理について説明したが、エコーキャンセラに限らず周囲の雑音を除去する処理にも使用することができる。例えば、通話するユーザの口元の方を向いているマイクの音声入力をEC処理及び音源分離処理に使用して、ユーザの口元と反対側の方を向いているマイクを別の雑音除去用入力に切り替える。反対側のマイクの音声入力を無指向性などの指向性が異なるマイクの入力信号と切り替えたり、音声入力に雑音除去用の処理をした信号と切り替えたりする場合などである。EC参照信号Refとは異なる雑音除去用の入力信号を使用することにより、スピーカからの出力音声のエコーの除去と、スピーカ出力以外の外部雑音とを参照信号に取り込むことができる。
なお、実施の形態では、音源分離部111は、連続する2フレームの音声入力信号に対して、連続する2フレームのEC参照信号Refを用いて、1フレーム分の音源分離処理を行う。音源分離処理に用いるフレーム数は、連続する2フレームに限る必要はなく、連続するフレームであれば、2フレーム以上でもかまわない。マイク入力信号とEC参照信号Refとを切り替えるタイミングをずらして、2つのチャンネルをEC参照信号入力にするフレームの数は、音源分離処理で用いる連続するフレーム数に依存して決定する。従って、性能劣化防止部112の切替中の処理回数を適切な値に設定することにより、2つ以上の連続するフレームを処理する音源分離部111を備える雑音除去装置でも用いることができる。
また、性能劣化防止部112は、音源分離部111で使用する連続する2フレーム以上の電気信号及びEC参照信号Refを同じスイッチを経由した信号を使うように選択する。性能劣化防止部112の選択により、音源分離部111は、同じ経路の連続したフレーム毎で音源分離処理をすることができ、切り替え中の状態でない「手持」状態や「卓上」状態の場合と同様の処理を行うことができる。
(実施の形態の変形例)
なお、本発明の実施の形態の変形例として、EC参照信号Refには固定のチャネルを割り当て、音声入力を切り替える場合が考えられる。例えば図1の音声入力部12の構成を、マイク120とマイク123との音声入力信号を切り替えてA−D変換器124のch0に入力するSW2と、EC参照信号Refを直接A−D変換器124のch3に入力する場合である。図14では、音声入力チャネルのみを切り替えた場合のタイミングチャートを示す。ch0マイク入力信号がマイク120から123に切り替わった時間(t1)のフレーム(3f)を使用せずに、ch1、ch2のマイク入力信号に対してch3のEC参照信号Refを用いて音源分離処理を行ってもよい。
実施の形態の変形例によれば、携帯端末20の形状を変化させて利用する場合でも、必ずEC参照信号Refを確保できる。変形例では、切り替える音声入力チャネルのみを一時的に使用しないので、途切れることなく雑音やエコーを除去でき、雑音除去処理やエコー除去処理の性能劣化を防止できる。また、変形例は、実施の形態と比べて、スイッチの数を減らすことができ、スイッチの切り替え処理を減らすことができるので、性能劣化防止部111の処理を軽減できる。
また、本発明は携帯端末に限定されるものではなく、デジタルビデオカメラやノートパソコンなどの該装置の形態を変更して利用できる装置でも同様の制御が可能である。
その他、前記のハードウエア構成やフローチャートは一例であり、任意に変更及び修正が可能である。
無線通信部10、制御部11、記憶部14、操作部15などから構成される雑音除去装置は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。例えば、前記の動作を実行するためのコンピュータプログラムを、コンピュータが読みとり可能な記録媒体(フレキシブルディスク、CD−ROM、DVD−ROMなど)に格納して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、前記の処理を実行する雑音除去装置を構成してもよい。また、インターネットなどの通信ネットワーク上のサーバ装置が有する記憶装置に当該コンピュータプログラムを格納しておき、通常のコンピュータシステムがダウンロードなどすることで雑音除去装置を構成してもよい。
また、雑音除去装置の機能を、OS(オペレーティングシステム)とアプリケーションプログラムの分担、又はOSとアプリケーションプログラムとの協働により実現する場合などには、アプリケーションプログラム部分のみを記録媒体や記憶装置に格納してもよい。
また、搬送波にコンピュータプログラムを重畳し、通信ネットワークを介して配信することも可能である。たとえば、通信ネットワーク上の掲示板(BBS, Bulletin Board System)に前記コンピュータプログラムを掲示し、ネットワークを介して前記コンピュータプログラムを配信してもよい。そして、このコンピュータプログラムを起動し、OSの制御下で、他のアプリケーションプログラムと同様に実行することにより、前記の処理を実行できるように構成してもよい。
本発明の実施例に係る携帯端末の構成を示すブロック図である。 本発明の雑音処理装置の構成を示すブロック図である。 端末利用状態が「手持」の場合の携帯端末の外観を示す図である。 端末利用状態が「卓上」の場合の携帯端末の外観を示す図である。 動作モード情報の構成を示す図である。 システム設定情報の構成を示す図である。 制御部が実行するテレビ電話処理を示すフローチャートである。 利用状態検出部が実行する利用状態検出処理を示すフローチャートである。 音処理を示すフローチャートである。 性能劣化防止部が実行する性能劣化防止処理を示すフローチャートである。 性能劣化防止部が実行する利用状態切替時処理のフローチャートである。 端末利用状態が「手持」から「卓上」に変化した時のタイミングチャートである。 端末利用状態が「卓上」から「手持」に変化した時のタイミングチャートである。 音声入力チャネルのみ切り替える場合のタイミングチャートである。 性能劣化防止処理をしない場合に変化した時のタイミングチャートである。
符号の説明
1、2・・・スイッチ、10・・・無線通信部、11・・・制御部、12・・・音声入力部、13・・・音声出力部、14・・・記憶部、15・・・操作部、16・・・撮像部、17・・・表示部、18・・・利用状態検出部、19・・・バス、20・・・携帯端末、21・・・携帯端末の上側筐体、22・・・携帯端末の下側筐体、23・・・ヒンジ部、24・・・スピーカ、111・・・音源分離部、112・・・性能劣化防止部、120、121、122、123・・・マイク、124・・・A−D変換器

Claims (7)

  1. 音を電気信号に変換する3つ以上の音入力手段と、
    前記音入力手段で入力する前記電気信号のうち、目的とする音以外の雑音成分の少なくとも一部を含む雑音参照信号を入力する参照信号入力手段と、
    前記電気信号と前記雑音参照信号のうち、2以上の前記電気信号と前記雑音参照信号を選択して入力する入力選択手段と、
    所定の単位時間ごとに、前記入力選択手段で入力した前記電気信号から前記雑音参照信号の成分を除去する音源分離手段と、
    前記入力選択手段で選択して入力する前記電気信号の組み合わせを切り替える切替手段と、
    前記切替手段が前記入力選択手段で入力する前記電気信号の組み合わせを切り替えたときに、その切り替えた時刻を含む前記単位時間と、そののち所定の回数の前記単位時間が経過するまで、前記切替に関与した前記電気信号を前記音源分離手段の対象から除外する性能劣化防止手段と、
    を備えることを特徴とする雑音除去装置。
  2. 前記入力選択手段は、前記電気信号のいずれかと前記雑音参照信号とのいずれかを選択して入力するスイッチを複数備え、
    前記切替手段は、前記入力選択手段で前記電気信号と前記雑音参照信号とを切り替える場合に、前記電気信号を入力していた第1の前記スイッチの入力を前記雑音参照信号に切り替える第1の切替を行ったのち、所定の回数の前記単位時間が経過してから、前記第1の切替の前に前記雑音参照信号を入力していた第2の前記スイッチの入力を前記電気信号を入力するように切り替える第2の切替を行い、
    前記性能劣化防止手段は、前記音源分離手段に、前記第1の切替の時刻を含む前記単位時間では前記第2のスイッチで入力する前記雑音参照信号を用い、前記第2の切替の時刻を含む前記単位時間では前記第1のスイッチで入力する前記雑音参照信号を用いて、入力した前記電気信号から前記雑音参照信号の成分を除去させる、
    ことを特徴とする請求項1に記載の雑音除去装置。
  3. 前記音源分離手段は、連続する2以上の前記単位時間の前記電気信号及び前記雑音参照信号を用いて、1つの前記単位時間の前記電気信号について前記雑音参照信号の成分を除去する処理を行い、
    前記第1の切替と第2の切替の間で経過する前記単位時間の所定の回数は、前記音源分離手段で用いる前記電気信号及び前記雑音参照信号の連続する単位時間の個数以上であって、
    前記性能劣化防止手段は、全ての前記単位時間について、前記音源分離手段が用いる連続する2以上の前記単位時間の前記電気信号及び前記雑音参照信号が、それぞれいずれも同じスイッチを経由した信号となるように、前記音源分離手段で用いる前記電気信号及び前記雑音参照信号を選択する、
    ことを特徴とする請求項2に記載の雑音除去装置。
  4. 前記雑音除去装置は、その形状を変更して利用可能であって、
    前記切替手段は、前記雑音除去装置の形状が変化した場合に、前記入力選択手段で選択して入力する前記電気信号の組み合わせを切り替える、
    ことを特徴とする請求項1乃至3のいずれか1項に記載の雑音除去装置。
  5. 前記性能劣化防止手段は、前記入力選択手段で選択する前記電気信号と前記雑音参照信号の組み合わせの情報と、前記切替手段が前記入力選択手段で入力する前記電気信号の組み合わせを切り替えたことを表す情報とを記憶する制御情報記憶手段を備え、
    前記音源分離手段は、前記入力選択手段で選択する前記電気信号と前記雑音参照信号の組み合わせの情報と、前記切替手段が前記入力選択手段で入力する前記電気信号の組み合わせを切り替えたことを表す情報に基づいて、前記入力選択手段で入力した前記電気信号から前記雑音参照信号の成分を除去する処理の対象を判別する、
    ことを特徴とする請求項1乃至4のいずれか1項に記載の雑音除去装置。
  6. 音を入力して3つ以上の電気信号に変換する音入力ステップと、
    前記音入力ステップで入力する前記電気信号のうち、目的とする音以外の雑音成分の少なくとも一部を含む雑音参照信号を入力する参照信号入力ステップと、
    前記電気信号と前記雑音参照信号のうち、2以上の前記電気信号と前記雑音参照信号を選択して入力する入力選択ステップと、
    所定の単位時間ごとに、前記入力選択ステップで入力した前記電気信号から前記雑音参照信号の成分を除去する音源分離ステップと、
    前記入力選択ステップで選択して入力する前記電気信号の組み合わせを切り替える切替ステップと、
    前記切替ステップで、前記入力選択ステップで選択して入力する前記電気信号の組み合わせを切り替えたときに、その切り替えた時刻を含む前記単位時間と、そののち所定の回数の前記単位時間が経過するまで、前記切替に関与した前記電気信号を前記音源分離ステップの対象から除外する性能劣化防止ステップと、
    を備えることを特徴とする雑音除去方法。
  7. コンピュータに、
    音を入力して3つ以上の電気信号に変換する音入力ステップと、
    前記音入力ステップで入力する前記電気信号のうち、目的とする音以外の雑音成分の少なくとも一部を含む雑音参照信号を入力する参照信号入力ステップと、
    前記電気信号と前記雑音参照信号のうち、2以上の前記電気信号と前記雑音参照信号を選択して入力する入力選択ステップと、
    所定の単位時間ごとに、前記入力選択ステップで入力した前記電気信号から前記雑音参照信号の成分を除去する音源分離ステップと、
    前記入力選択ステップで選択して入力する前記電気信号の組み合わせを切り替える切替ステップと、
    前記切替ステップで、前記入力選択ステップで選択して入力する前記電気信号の組み合わせを切り替えたときに、その切り替えた時刻を含む前記単位時間と、そののち所定の回数の前記単位時間が経過するまで、前記切替に関与した前記電気信号を前記音源分離ステップの対象から除外する性能劣化防止ステップと、
    を実行させることを特徴とするコンピュータプログラム。
JP2008139990A 2008-05-28 2008-05-28 雑音除去装置、雑音除去方法及びコンピュータプログラム Expired - Fee Related JP5034118B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008139990A JP5034118B2 (ja) 2008-05-28 2008-05-28 雑音除去装置、雑音除去方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008139990A JP5034118B2 (ja) 2008-05-28 2008-05-28 雑音除去装置、雑音除去方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2009290483A JP2009290483A (ja) 2009-12-10
JP5034118B2 true JP5034118B2 (ja) 2012-09-26

Family

ID=41459272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008139990A Expired - Fee Related JP5034118B2 (ja) 2008-05-28 2008-05-28 雑音除去装置、雑音除去方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5034118B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6424662A (en) * 1987-07-21 1989-01-26 Nippon Telegraph & Telephone Voice conference equipment
JP2001215990A (ja) * 2000-01-31 2001-08-10 Japan Science & Technology Corp ロボット聴覚装置
JP4266148B2 (ja) * 2003-09-30 2009-05-20 株式会社東芝 電子機器
JP4192800B2 (ja) * 2004-02-13 2008-12-10 ソニー株式会社 音声集音装置と方法
JP4536020B2 (ja) * 2006-03-13 2010-09-01 Necアクセステクニカ株式会社 雑音除去機能を有する音声入力装置および方法

Also Published As

Publication number Publication date
JP2009290483A (ja) 2009-12-10

Similar Documents

Publication Publication Date Title
CN109559763B (zh) 一种实时数字音频信号混音的方法及装置
CN109062535B (zh) 发声控制方法、装置、电子装置及计算机可读介质
JP2005277999A (ja) 携帯情報端末及び携帯情報端末の音声出力調整方法
US9014538B2 (en) Moving image processing apparatus, moving image playback apparatus, moving image processing method, moving image playback method, and storage medium
US20170126801A1 (en) Method, apparatus, and storage medium for performing media synchronization
KR20110002630A (ko) 휴대 단말기의 카메라 운용 방법 및 장치
JP2008532394A (ja) 複数のイメージバッファを使用してイメージを処理するための方法、電子デバイス、及びコンピュータプログラム製品
US20140270199A1 (en) Notification control device, notification control method and storage medium
JP2009055137A (ja) 携帯端末装置
US20100075650A1 (en) Method of changing status of instant message software
JP5838852B2 (ja) 撮像システム、撮像装置、撮像方法及びプログラム
US9224381B2 (en) Audio signal processing apparatus and audio signal processing system
JP5034118B2 (ja) 雑音除去装置、雑音除去方法及びコンピュータプログラム
US11388281B2 (en) Adaptive method and apparatus for intelligent terminal, and terminal
JP5070594B2 (ja) 情報処理装置、情報処理装置の音源分離方法及びプログラム
KR20230039715A (ko) 필터링 수단에 의한 에코 제거 방법, 전자 디바이스 및 컴퓨터 판독가능 저장 매체
JP2018074220A (ja) 音声処理装置
JP6985821B2 (ja) 音声処理装置及びその制御方法
JP2006203398A (ja) 出力先切替方法およびそれを利用した通信装置
US9767851B2 (en) Document camera, video and audio output system, and video and audio output method
CN105898026B (zh) 移动终端录音提示方法、提示装置及其移动终端
JP2016009952A (ja) 音声信号処理装置
KR101129563B1 (ko) 영상 촬영 기능을 갖는 이동통신 단말기
JP2009141486A (ja) 画像再生装置およびその制御方法、プログラム
KR20100010151A (ko) 음원 재생 기능을 갖는 휴대용 촬영 장치 및 그 제어 방법

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20100806

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110413

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120615

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees