JP2008205957A - 受音装置及びその方法 - Google Patents

受音装置及びその方法 Download PDF

Info

Publication number
JP2008205957A
JP2008205957A JP2007041289A JP2007041289A JP2008205957A JP 2008205957 A JP2008205957 A JP 2008205957A JP 2007041289 A JP2007041289 A JP 2007041289A JP 2007041289 A JP2007041289 A JP 2007041289A JP 2008205957 A JP2008205957 A JP 2008205957A
Authority
JP
Japan
Prior art keywords
sound
initialization
receiving device
lock
sound receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007041289A
Other languages
English (en)
Other versions
JP4799443B2 (ja
Inventor
Ko Amada
皇 天田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007041289A priority Critical patent/JP4799443B2/ja
Priority to US12/014,473 priority patent/US8121310B2/en
Publication of JP2008205957A publication Critical patent/JP2008205957A/ja
Application granted granted Critical
Publication of JP4799443B2 publication Critical patent/JP4799443B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

【課題】複数の話者が音声を入力する場合に、話者の切り替えと筐体の姿勢の変化による指向方向の制御を効率良く行うことが可能な受音装置を提供する。
【解決手段】マイクロホン101−1〜Mと、筐体105の姿勢情報を入力する入力端子102と、ロック情報が入力する入力端子103と、ロック情報が入力したときの姿勢情報を記憶する姿勢情報記憶部104と、姿勢情報と初期化方向に基づき目的音方向を算出する目的音方向算出部106と、目的音方向に基づき指向方向を決定する指向方向算出部107と、この指向方向に基づき複数のマイクロホンの信号を処理し指向方向の信号を強調出力する指向性形成部108から構成される。
【選択図】 図1

Description

本発明は、音声強調技術の一つであるマイクロホンアレー技術を携帯端末等に実装し、複数の話者に対し効率良く指向性を形成する受音装置及びその方法に関するものである。
マイクロホンアレー技術は、複数のマイクロホンを用いて、受音した信号に対し信号処理を行い指向性を形成し、指向性の向いている方向から到来する信号を強調し、それ以外の音を抑圧する音声強調技術の1つである。
例えば、最も簡単な方法として遅延和アレーが挙げられる(非特許文献1参照)。この方法は各マイクロホンの信号に所定の遅延を挿入し加算する処理を行うことで、事前に設定された方向から到来した信号のみが同位相で足し合わされ強調されるのに対し、その他の方向から到来した信号は位相が揃わず弱め合うという原理に基づく。
また、適応型アレーと呼ばれる方法は、入力信号に応じてフィルタ係数を逐次更新し、目的方向以外の方向から到来する妨害音を選択的に除去するものであり、高い雑音抑圧性能を持つ特徴がある。
近年、このようなマイクロホンを携帯電話やPDA等の携帯機器に実装し、ユーザの声をより明瞭に捉えるという応用が盛んである。この場合に指向性をどの方向に形成するかは重要な問題である。例えば携帯電話の場合、電話を持って話をする姿勢が既知なので、目的音方向である話者の口の方向に指向性を形成するように予め設計しておくことは妥当である。
また、音声翻訳携帯端末のように複数の人が入力する場合、現在発話している話者はどの方向か、つまり目的音方向はどこかを適切に設定する必要がある。
そして、端末に固定した指向方向を持たせ、ユーザーが常に指向方向が発話者の方向を向くように、丁度新聞記者がインタビューでマイクロホンを自分と相手に交互に向けるように動かすという方法は簡便である。しかし、煩わしい上に、端末の向きによっては画面が見えなくなる等の問題がある。また、PDAのように、使用中に端末の姿勢(角度等)が変化する可能性がある場合は、端末に固定された指向方向を意識しながら使わなければならないという不自由さもある。
大賀他著、「音響システムとディジタル処理」,電子情報通信学会,1995
このように、マイクロホンアレーを搭載した端末に複数の人が入力する場合、指向方向を話者交代等に伴い変化する目的音方向に合わせる必要があり、煩わしいばかりか、端末の向きによっては画面が見えなくなる等の不都合があった。また、発話中に端末の姿勢が変る場合は、せっかく合わせた指向方向が目的音方向からずれるという問題点があった。
そこで本発明は上記問題を解決するものであり、端末の姿勢が変化しても音の指向方向が常に一定方向を向くように制御される受音装置及びその方法を提供することを目的とする。
本発明は、筐体に設けられた複数の受音部と、前記筐体の予め設定された初期化方向を、前記筐体を中心とした端末座標系で記憶する初期化方向記憶部と、実空間に対応したワールド座標系における前記筐体の姿勢を表す姿勢情報を検出する姿勢情報検出部と、受音を行うタイミングを表すロック情報を出力するロック情報出力部と、前記ロック情報が入力した時の前記姿勢情報を、ロック姿勢情報として記憶する姿勢情報記憶部と、前記ロック姿勢情報を用いて、前記端末座標系によって表された初期化方向を前記ワールド座標系における方向である目的音方向に変換する方向変換部と、前記目的音方向に受音のための指向性を定めて、前記複数の受音部によって受音する指向性受音部と、を有する受音装置である。
本発明によれば、筐体を動かしても目的音が常に高い感度で受音できる。
以下、本発明の実施形態の受音装置100について図面に基づいて説明する。
(第1の実施形態)
本発明の第1の実施形態に係わる受音装置100について図1、図6、図7に基づいて説明する。
(1)受音装置100の構成
図1は、本実施形態に係わる受音装置100の構成を示すブロック図である。
受音装置100は、マイクロホン101−1〜Mと、受音装置100の筐体105の姿勢情報を入力する入力端子102と、姿勢情報を記憶するタイミングを示すロック情報が入力する入力端子103と、前記タイミングで姿勢情報を記憶する姿勢情報記憶部104と、姿勢情報に基づき実空間での目的音方向を算出する目的音方向算出部106と、入力端子102からの姿勢情報と目的音方向算出部106の出力に基づき受音装置100から見てどの方向に指向性を向ければ良いかを決定する指向方向算出部107と、算出された指向方向に基づき複数のマイクロホンの信号を処理し、指向方向を向けた方向の信号を強調出力する指向性形成部108から構成される。これら各部101〜108は、直方体の筐体105に収納されている。
ロック情報としては、受音装置100に備え付けてあるロックボタンをユーザが押すなどが考えられる。
また、ロックボタンを発話開始時に押すボタンと共用することもできる。
さらに、アプリケーションと連動して話者の発話が必要になったタイミングを見計らってアプリケーションが自発的にロック信号を発するという構成も可能であるなど、様々な方法が考えれる。
(2)受音装置100の動作内容
次に、受音装置100の動作について述べる。
まず、入力端子102には、受音装置100の筐体105の姿勢が時々刻々に入力される。受音装置100の筐体105の姿勢は、例えば3軸加速度センサや3軸磁気センサを用いることで検出が可能である。これらのセンサーは、例えば、受音装置100に搭載可能な小型チップである。
入力端子103には、前記ロック情報が入力された時点での受音装置100の筐体105の姿勢が姿勢情報記憶部104で保持される。
目的音方向算出部106では、検出された受音装置100の筐体105の姿勢と、予め設定された筐体105に定められている初期化方向とから実空間における目的信号の方向を算出する。「初期化方向」とは、例えば、受音装置100の筐体105が直方体であり、その長辺方向が指し示す方向を初期化方向と設定する。そして、「目的音方向」とは、ロック情報が入力された時に受音装置100の筐体105の長辺方向(初期化方向)が天井を向いていれば、天井方向を目的音方向とする。
指向方向算出部107では、入力端子102に入力された姿勢情報と目的音方向算出部106から出力された目的音方向を用いて、時々刻々と変化する受音装置100の筐体105の姿勢に対し、目的音方向は受音装置100から見てどの方向になるかを算出する。先の例では、目的音方向は天井方向であるが、ロック後に受音装置100の筐体105を水平方向きに動かした場合、受音装置100から見て目的音方向は、長辺方向と直角方向になるように制御される。
指向性形成部108では算出された方向に指向性を形成し、信号処理によりその方向の信号を強調するようにマイクロホン101−1〜101−Mに入力された信号を処理する。
(3)具体例
(3−1)第1の具体例
本実施形態の第1の具体例を図6を用いて説明する。
図6に示されている受音装置100の筐体105の4隅にマイクロホン101−1〜101−4が搭載されている。
図6(a)は、起動時における受音装置100の筐体105と実空間との関係を示している。
起動時に内蔵のセンサ等を用いることで、受音装置100の筐体105の実空間に対する姿勢を得る。例えば南方向をX軸、西方向をY軸、天井方向をZ軸とする座標系(以下、「ワールド座標系」と呼ぶ)において、現在の受音装置100の筐体105の姿勢を各軸の回転角(θx,θy,θz)で表すことができる。
一方で、受音装置100の筐体105に固定された座標系(以下、「端末座標系」と呼ぶ)も存在し、図6のように縦方向をx軸、横方向をy軸、法線方向をz軸とする。さらに、初期化方向として端末座標系でp=(1,0,0)の方向、すなわち、x軸方向を設定する。
次に、受音装置100の筐体105を動かし、図6(b)の状態でユーザが受音装置100に対しロック情報を出力する。受音装置100はこのロック情報に基づき受音装置100の初期化方向pを目的音方向tとする。目的音方向tは受音装置100に搭載されたマイクロホン101−1〜101−Mの指向性を向ける方向であり、端末座標系で得られている必要がある。
しかし、ロック後に受音装置100の筐体105が動くことを考えると、目的音方向tをワールド座標系に変換し、受音装置100の動きに対して不変とする方が扱いやすい。
具体的には端末座標系からワールド座標系への座標変換行列を使って

T=RL*t
=RLz*RLy*RLx*t (1)

と変換する。なお、「*」は積を表す。ここで、RLはロック時の端末座標からワールド座標への3x3の変換行列で、x,y,z軸に関する回転行列、
Figure 2008205957
の積に分解することができる。ここで、(φx,φy,φz)はロック時の各座標軸に対する回転角である。
図6(c)にロック後の動作を示す。受音装置100に搭載されたマイクロホンアレーはその指向方向をロックされた時の目的音方向に常に向けるように制御される。そのため受音装置100の姿勢の変化に対し、目的音方向は端末座標系においてどの方向かを知ることが重要である。
その方法は次の通りである。ロック時に記憶された目的音方向T、現在の受音装置100の姿勢(θx,θy,θz)を用いて、端末座標系での目的音方向tを、

t=inv(R)*T
=inv(Rz*Ry*Rx)*T
=inv(Rx)*inv(Ry)*inv(Rz)*T (5)

と求める。但し、Rは端末座標系からワールド座標系への変換行列、inv(R)はその逆変換行列(つまりワールド座標系から端末座標系への変換行列)、Rx,Ry,Rzは各軸回りの回転行列であり、式(2)〜(4)の(φx,φy,φz)を現在の姿勢に対応する回転角(θx,θy,θz)に置き換えた行列である。
このように、目的音方向をワールド座標系で記憶し、受音装置100の筐体105の姿勢を参照し端末座標系に変換することで、受音装置100の姿勢の変化によらず端末座標系からみた目的音方向を知ることができる。
(3−2)第2の具体例
第2の具体例について説明する。上記第1の具体例では、目的音方向Tを記憶してこれを端末座標に変換した。しかし、ロック時からの受音装置100の筐体105の姿勢の差分を検出し、目的音方向Tを介さず目的音方向tを直接求めることも可能である。式で説明すると次のようになる。
ロック後のある時点での座標変換行列は、

R=RL*Rd

と表すことができる。但しRLは式(1)と同様にロック時の変換行列、Rdはロック時以降の姿勢の差分を表す変換行列である。Rをこのように分解して考えると目的音方向tは、

t=inv(R)T
=inv(RL*Rd)T
=inv(Rd)inv(RL)T
=inv(Rd)p

となり、ロック時の初期化方向pとそれ以降の姿勢の差分を表す変換行列Rdから直接求めることができる。
(3−3)その他の具体例
このように端末座標における目的音方向tとワールド座標での目的音方向Tとの関係を求める方法は複数あり、本実施形態はその方法を限定するものではない。
また、座標系に関しても、座標軸を本実施形態のように左手系で定義する他にz軸を反対向きにとる右手系でもよい。
また、式(1)の変換式を本実施形態ではtからTへの変化としたが、Tからtへの変換で定義してもよい。これらの定義の違いで回転角(θx,θy,θz,)や式(2)〜(4)の符号等が変る場合があるが本実施形態においては、本質的な問題ではなく、いずれか1つの定義を用いれば良い。
(4)指向性形成部108の動作
次に、図1の指向性形成部108の動作の例を述べる。
(4−1)第1の方法
指向方向算出部107から端末座標系における現時点での目的音方向tが得られるので、既存のマイクロホンアレーの技術を用いてその方向に指向性(指向方向)を形成する。
例えば、適応型アレーの例として方向拘束付出力電力最小化法(DCMP)(菊間著、「アレーアンテナによる適応信号処理」の第5章参照、科学技術出版発行、1998)では指向方向に対するアレーの方向ベクトルcを求め、アレー重みを、

w=inv(Mxx)c/cH*inv(Mxx)c

と求めることができる。但し、inv(Mxx)はマイクロホン間の相関行列Mxxの逆行列、cHはcの複素共役転置である。
また、遅延和アレー(非特許文献1の第7章参照)の場合は、

w=c/cH*c

と求めることができる。これは、各マイクロホン101に対する信号の到達時間差が指向方向に対して0になるように信号を遅延させることと等価である。
さらに指向方向に応じて事前に用意した重みを選択する方法もあり、例えばマイクロホンが2つの場合

w=(1,0)’or(0,1)’

のいずれか(’は転置)を用いる例を考えると、これは2つのマイクロホンからどちらかを選択することと等価となる。
選択の基準は指向方向とアレーの配置の関係で決まり、例えば、マイクロホン間を結ぶ直線と指向方向が鋭角を成す側のマイクロホンの成分が1となるwを用いる例や、指向性マイクロホンを用いる場合は(マイクロホンの)指向特性と指向方向の成す角がより狭いマイクロホンの成分が1となるwを用いる等の例が考えられる。
このようにして得られた重みwを用いてマイクロホン101−1〜101−Mで受音した信号a1〜aMを重み付け加算することで、目的音方向に指向性を向けて処理された信号bが、

b=wH*a

で得られる。但し、a=(a1,a2,・・・,aM)’,w=(w1,w’2,・・・,w’M)’であり、w’Hはw’の複素共役転置である。
他にも目的音方向に指向性を形成する方法は存在し、適応型アレーではGriffiths-Jim型アレー(L.J. Griffiths and C.W. Jim,「An Alternative Approach to Linearly Constrained Adaptive Beamforming,」参照 IEEE Trans. Antennas & Propagation,Vol. AP-30,No.1,Jan.,1982)等もしばしば用いられる。
(4−2)第2の方法
また、目的音方向に対して一定の許容範囲(例えば±20度など)を設け、その範囲から到来した信号に対して強調動作をするという方法もある、
例えば、非特許文献(永田著、「話者追尾2チャネルマイクロホンアレーに関する検討」参照、電子情報通信学会論文誌A、J82-A、6、pp.860-866、1999)の方法は許容範囲内の信号の強調を、従来型のアルゴリズムを巧に組み合わせ目的信号を追尾することにより実現している。
このアルゴリズムを本実施形態の指向性形成部108に用いることは効果的であり、許容範囲を設けることで、受音装置100の筐体105の姿勢検出の誤差や、音源が厳密には平面波ではないという前提条件からのズレを軽減するという効果がある。
このように、指向性形成の手段はさまざまであり、本実施形態は指向性の形成方法を限定するものではなく、他の従来技術も利用可能である。
(5)利用方法
図7に本実施形態の利用方法を模式的に表した図を示す。この例では2人の人が向かい合い、左側の人が受音装置100の筐体105を持っている。
相手の声を入力しようとする場合に図7(a)のロック時に示すように、受音装置100の筐体105の長辺方向を相手に向けロックボタンを押す。受音装置100の筐体105の長辺は初期化方向になっているため、目的音方向が矢印のように設定される。
その後、図7(b)の動作時のように受音装置100の筐体105の画面等を見るために受音装置100の筐体105の姿勢を変えたとしても、目的音方向は矢印のように相手方向に固定されているため、受音装置100の筐体105に搭載されているマイクロホンアレー等の受音システムの指向方向が目的音方向から外れてしまうことはない。
(第2の実施形態)
本発明の第2の実施形態に係わる受音装置100について図2、図8、図11に基づいて説明する。
(1)受音装置100の構成
図2は、本実施形態に係わる受音装置100の構成を示すブロック図である。
本実施形態と第1の実施形態の異なる点は、初期化方向辞書201が加わっている点である。第1の実施形態では初期化方向は受音装置100の筐体105の長辺など1つに固定されていた。しかし、本実施形態ではこれを複数個備え、姿勢情報記憶部104の出力により切り替える。
(2)利用方法
図8を用いて具体的な利用方法を述べる。この利用方法では、受音装置100の筐体105は初期化方向として長辺方向と法線方向の2種類を備えている。
図8(a)のように受音装置100の筐体105を寝かせてロックした場合は長辺方向の初期化方向が選択され、相手の声の方向に指向方向が形成される。
これに対し、図8(b)のように受音装置100の筐体105を立ててロックした場合は自分の声の方向に指向方向が形成される。
(3)処理方法
図11に処理方法のフローチャートを示す。
ステップ1において、ロック情報が入力されたかどうか判定をする。
入力されていれば、ステップ2で受音装置100の筐体105の姿勢を検出する。
ステップ3において、姿勢に応じた初期化方向pを選択する。
ステップ4において、初期化方向pをワールド座標に座標変換して、目的音方向Tを算出する。
ステップ5において、受音装置100の筐体105の姿勢に応じて端末座標から見た目的音方向t、すなわち、指向方向を算出する。
ステップ6において、指向方向の信号が強調されるように、マイクロホンアレーのパラメータが設定される。
これにより、ステップ7において入力信号の処理を行うことで受音装置100の筐体105の姿勢によらず目的音方向の信号を強調することができる。
ステップ8において、処理を継続するか判断し、noならば終了、yesならばステップ1に戻る。
ステップ1において、noの場合は目的音方向の算出は行わず、ステップ5に飛び、既に求められている目的音方向に従い、現在の指向方向pを受音装置100の筐体105の姿勢に応じて算出する。
例外処理として初めてステップ1の処理を行う時はロック情報が入力されるまで待つように設定する。
(4)効果
本実施形態のように複数の初期化方向を設けることで、話者は受音装置100の筐体105に対しほぼ180度方向に存在する場合でも、ロックするために受音装置100の筐体105を動かす角度は90度程度ですみ、使いやすさがより向上する。
(第3の実施形態)
本発明の第3の実施形態に係わる受音装置100について図3、図9、図11に基づいて説明する。
本実施形態と第2の実施形態と異る点は、初期化方向辞書201の代わりに初期化範囲辞書301を備えている点である。ロック情報が入力された時に第2の実施形態では初期化方向が選択されたが、本実施形態では初期化範囲が選択される。
(1)受音装置100の構成
図3は、本実施形態に係わる受音装置100の構成を示すブロック図である。
本実施形態はマイクロホン101−1〜Mと、受音装置100の筐体105の姿勢情報を入力する入力端子102、姿勢情報を記憶するタイミングを入力する入力端子103と、入力端子103の入力に従い受音装置100の筐体105の姿勢を記憶する姿勢情報記憶部104と、事前に用意された複数個の目的音範囲を格納した初期化範囲辞書301と、初期化範囲辞書から姿勢情報記憶部104の出力に応じた目的音範囲を選択する目的音範囲算出部302と、マイクロホン101−1〜101−Mに入力された信号から音源方向を推定する音源方向推定部305と、推定された音源方向が目的音範囲算出部302で得られた目的音範囲内か否かを判定し、範囲内である場合はその音源方向を初期化方向として出力する判定部303と、判定部の出力と入力端子102からの姿勢情報に基づき目的音方向を算出する目的音方向算出部106と目的音方向算出部106の出力をもとに受音装置100の筐体105においてどの方向に指向性を向ければ良いかを決定する指向方向算出部107と、算出された指向方向に基づき複数のマイクロホンの信号を処理し、指向方向を向けた方向の信号を強調出力する指向性形成部108から構成される。
(2)受音装置100の動作
次に本実施形態の動作を説明する。
受音装置100の筐体105を話者の方向に向けてロックをしても初期化方向が話者の方向とわずかにずれていることはありえる。そこで、初期化方向の代りに、それより少し角度に余裕を持たせた(例えば、受音装置100の筐体105の長辺方向±20度など)初期化範囲を設定する。
その後、受音装置100の筐体105の向けられた人の発話の方向を音源方向推定部305で推定し、その方向を初期化方向として目的音方向算出部106で上記実施形態と同様に目的音方向の算出を行い、指向性の形成の処理へと進む。
ここで、初期化範囲が設定され相手が発話する間に、他の方向から雑音等が発生する可能性はある。判定部303は音源方向が初期化範囲から外れているか否かを判定し、外れていた場合は、目的音方向算出の処理に進まないようにする。
(3)利用方法
図9に本実施形態の利用方法を模式的に表した図を示す。
図9(a)において、相手方向に対する初期化範囲(図の矢印で挟まれた範囲)が設定される。
次に、図9(b)において、相手の発話方向に基づいて初期化範囲が確定し、これが目的音方向となる。
このような構成にすることで、初期化方向を厳密に発話相手に向ける必要がなく、おおよその向きが合っていればよいという効果がある。
(第4の実施形態)
本発明の第4の実施形態に係わる受音装置100について図4に基づいて説明する。
図4は、本実施形態に係わる受音装置100の構成を示すブロック図である。本実施形態は、第2の実施形態の指向方向算出部107がなくなり、目的音方向算出部306の出力が指向性形成部108に直接渡されている点が異なる。
第2の実施形態において指向性形成部108の入力である端末座標上での目的音方向tは式(5)の変換で得られる。この計算を現在の姿勢に対応する回転角(θx,θy,θz)に基づき逐次行う必要があるが、一方で目的音方向がそれほど大きく変らない場合は、逐次計算した場合とロック時の回転角(φx,φy,φz)で求めた場合とで目的音方向tの値に大差がない。本実施形態では目的音方向tを、ロック時に求めた値に固定してしまうことでその後の逐次計算を行わず済む構成としている。
本実施形態は、ロック後に受音装置100の筐体105の姿勢が大きく変化する可能性がある場合には不向きであるが、変化が小さい場合は目的音方向tを逐次更新する必要がなく、計算量を削減できる効果がある。
(第5の実施形態)
本発明の第5の実施形態に係わる受音装置100について図5、図10に基づいて説明する。
図5は、本実施形態に係わる受音装置100の構成を示すブロック図である。本実施形態は、第4の実施形態の入力端子103と姿勢情報記憶部104が除かれている構成となっている。
本実施形態では時々刻々と変化する受音装置100の筐体105の姿勢に基づいて初期化方向を選択し、これをそのまま指向方向として扱う構成になっている。
例えば、第6の実施形態で示すにように、受音装置100を音声翻訳装置に適用した場合、受音装置100の所有者と相手話者が向かい合って受音装置100を介して話をする状況が考えられる。図10(b)のように、所有者が受音装置100に音声を入力する時は受音装置100の筐体105を立て気味にし、相手に音声を入力してもらう時は図10(a)のように受音装置100の筐体105を寝かし気味にするのは自然な動作である。
このように目的音声の方向と受音装置100の筐体105の角度に密接な関係がある場合は、わざわざロック情報を与えるまでもなく、受音装置100の筐体105の姿勢だけで指向方向の切り替えが可能である。例えば3軸重力加速度センサを使えば重力加速度方向(下方向)を検出することが可能である。
この方向(図10のベクトルg)と受音装置100の筐体105の長辺方向のベクトル(r)の成す角が所定の値より小さいときは、相手の声に指向方向を向けるため受音装置100の筐体105の長辺方向に水平に設定されている初期化方向p1が選択され、大きいときは法線方向に設定されている初期化方向p2が選択される。
このような構成とすることで、ユーザは受音装置100の筐体105の動きだけで指向性を切り替えることが可能となり、よりスムーズな利用が可能となる。
(第6の実施形態)
本発明の第6の実施形態に係わる翻訳装置200について図6と図12に基づいて説明する。本実施形態は、第1の実施形態の受音装置100を翻訳装置に適用した場合である。
図12は、翻訳装置200のブロック図であり、受音装置100によって指向性方向の音声を翻訳部202が所定の言語(例えば、英語から日本語)に翻訳する。
図6に示すように相手に対しロックを行い、相手からの英語の音声を拾って、それを日本語に翻訳して、表示または日本語の音声で再生する。
(変更例)
本発明は上記各実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
本実施形態では音声を入力する手段としてマイクロホンを用いたが、事前に録音した信号等を再生して流し込む等の方法や、計算シミュレーション等で生成された信号を用いるなど、さまざまな方法があり、受音手段をマイクロホンに限定するものではない。
本発明の第1の実施形態に係わるブロック図である。 第2の実施形態に係わるブロック図である。 第3の実施形態に係わるブロック図である。 第4の実施形態に係わるブロック図である。 第5の実施形態に係わるブロック図である。 受音装置100の姿勢と目的音方向の関係を示す図である。 第1の実施形態の利用方法を示す図である。 第2の実施形態の利用方法を示す図である。 第3の実施形態の利用方法を示す図である。 第5の実施形態の利用方法を示す図である。 第2の実施形態のフローチャートである。 第6の実施形態に係わるブロック図である。
符号の説明
100 受音装置
101 マイクロホン
102 入力端子
103 入力端子
104 姿勢情報記憶部
106 目的音方向算出部
107 指向方向算出部
108 指向性形成部

Claims (12)

  1. 筐体に設けられた複数の受音部と、
    前記筐体の予め設定された初期化方向を、前記筐体を中心とした端末座標系で記憶する初期化方向記憶部と、
    実空間に対応したワールド座標系における前記筐体の姿勢を表す姿勢情報を検出する姿勢情報検出部と、
    受音を行うタイミングを表すロック情報を出力するロック情報出力部と、
    前記ロック情報が入力した時の前記姿勢情報を、ロック姿勢情報として記憶する姿勢情報記憶部と、
    前記ロック姿勢情報を用いて、前記端末座標系によって表された初期化方向を前記ワールド座標系における方向である目的音方向に変換する方向変換部と、
    前記目的音方向に受音のための指向性を定めて、前記複数の受音部によって受音する指向性受音部と、
    を有する受音装置。
  2. 前記初期化方向記憶部は、前記初期化方向を複数記憶し、
    前記ロック姿勢情報に基づいて、いずれかの一つの初期化方向を選択する方向選択部を有する、
    請求項1記載の受音装置。
  3. 受音の対象となる音源の方向を検出する音源方向検出部と、
    前記筐体に対して予め設定された範囲である初期化範囲を記憶する初期化範囲記憶部と、
    前記音源方向が、前記初期化範囲内である場合に、前記音源方向を前記初期化方向とする判定部と、
    を有する請求項1記載の受音装置。
  4. 前記初期化範囲記憶部は、前記初期化範囲を複数記憶し、
    前記ロック姿勢情報に基づいて、いずれかの一つの初期化範囲を選択する範囲選択部を有する、
    請求項3記載の受音装置。
  5. 前記指向性受音部は、前記初期化方向に指向性を定める、
    請求項1記載の受音装置。
  6. 前記ロック情報出力部は、前記筐体が特定の姿勢にある時に前記ロック情報を出力する、
    請求項1記載の受音装置。
  7. 前記ロック情報出力部は、前記筐体が特定の姿勢にある時に前記ロック情報を出力する、
    請求項5記載の受音装置。
  8. 前記ロック情報出力部は、ユーザの発話開始時に前記ロック情報を出力する、
    請求項1記載の受音装置。
  9. 前記指向性受音部は、前記目的音方向を含む所定の追尾範囲に指向性を定める、
    請求項1記載の受音装置。
  10. 前記指向性受音部は、前記目的音方向からの音声信号をより高い感度で受音できる前記一または複数の受音部を選択する、
    請求項1記載の受音装置。
  11. 前記筐体の予め設定された初期化方向を、前記筐体を中心とした端末座標系で記憶し、
    実空間に対応したワールド座標系における前記筐体の姿勢を表す姿勢情報を検出し、
    受音を行うタイミングを表すロック情報を出力し、
    前記ロック情報が入力した時の前記姿勢情報を、ロック姿勢情報として記憶し、
    前記ロック姿勢情報を用いて、前記端末座標系によって表された初期化方向を前記ワールド座標系における方向である目的音方向に変換し、
    前記目的音方向に受音のための指向性を定めて、前記筐体に設けられた複数の受音部によって受音する、
    受音方法。
  12. 前記筐体の予め設定された初期化方向を、前記筐体を中心とした端末座標系で記憶する初期化方向記憶機能と、
    実空間に対応したワールド座標系における前記筐体の姿勢を表す姿勢情報を検出する姿勢情報検出機能と、
    受音を行うタイミングを表すロック情報を出力するロック情報出力機能と、
    前記ロック情報が入力した時の前記姿勢情報を、ロック姿勢情報として記憶する姿勢情報記憶機能と、
    前記ロック姿勢情報を用いて、前記端末座標系によって表された初期化方向を前記ワールド座標系における方向である目的音方向に変換する方向変換機能と、
    前記目的音方向に受音のための指向性を定めて、前記筐体に設けられた複数の受音部によって受音する指向性受音機能と、
    をコンピュータによって実現する受音プログラム。
JP2007041289A 2007-02-21 2007-02-21 受音装置及びその方法 Expired - Fee Related JP4799443B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007041289A JP4799443B2 (ja) 2007-02-21 2007-02-21 受音装置及びその方法
US12/014,473 US8121310B2 (en) 2007-02-21 2008-01-15 Sound receiving apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007041289A JP4799443B2 (ja) 2007-02-21 2007-02-21 受音装置及びその方法

Publications (2)

Publication Number Publication Date
JP2008205957A true JP2008205957A (ja) 2008-09-04
JP4799443B2 JP4799443B2 (ja) 2011-10-26

Family

ID=39706684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007041289A Expired - Fee Related JP4799443B2 (ja) 2007-02-21 2007-02-21 受音装置及びその方法

Country Status (2)

Country Link
US (1) US8121310B2 (ja)
JP (1) JP4799443B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010161735A (ja) * 2009-01-09 2010-07-22 Xanavi Informatics Corp 音再生装置および音再生方法
JP2010212845A (ja) * 2009-03-09 2010-09-24 Yamaha Corp 音信号処理装置
JP2010283541A (ja) * 2009-06-03 2010-12-16 Fujitsu Ltd 携帯型無線通信装置およびその制御方法
KR20110064397A (ko) * 2009-12-08 2011-06-15 삼성전자주식회사 휴대용 단말기에서 블로우 방향을 인식하기 위한 장치 및 방법
JP2011135489A (ja) * 2009-12-25 2011-07-07 Fujitsu Ltd マイクロホンの指向性制御装置
JP2014510430A (ja) * 2011-01-13 2014-04-24 クアルコム,インコーポレイテッド モバイルプラットフォームでの可変ビーム形成
JP2015173502A (ja) * 2011-02-23 2015-10-01 クゥアルコム・インコーポレイテッドQualcomm Incorporated 空間的選択音声拡張のためのシステム、方法、装置、およびコンピュータ可読媒体
JP2015194557A (ja) * 2014-03-31 2015-11-05 株式会社東芝 電子機器および電子機器の制御方法

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2781702C (en) * 2009-11-30 2017-03-28 Nokia Corporation An apparatus for processing audio and speech signals in an audio device
TW201208335A (en) * 2010-08-10 2012-02-16 Hon Hai Prec Ind Co Ltd Electronic device
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
CN103024629B (zh) * 2011-09-30 2017-04-12 斯凯普公司 处理信号
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
US9098069B2 (en) * 2011-11-16 2015-08-04 Google Technology Holdings LLC Display device, corresponding systems, and methods for orienting output on a display
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
JP5865050B2 (ja) * 2011-12-15 2016-02-17 キヤノン株式会社 被検体情報取得装置
US9384737B2 (en) * 2012-06-29 2016-07-05 Microsoft Technology Licensing, Llc Method and device for adjusting sound levels of sources based on sound source priority
US9654868B2 (en) 2014-12-05 2017-05-16 Stages Llc Multi-channel multi-domain source identification and tracking
US9747367B2 (en) 2014-12-05 2017-08-29 Stages Llc Communication system for establishing and providing preferred audio
US20160165338A1 (en) * 2014-12-05 2016-06-09 Stages Pcs, Llc Directional audio recording system
US10609475B2 (en) 2014-12-05 2020-03-31 Stages Llc Active noise control and customized audio system
US9980075B1 (en) 2016-11-18 2018-05-22 Stages Llc Audio source spatialization relative to orientation sensor and output
US10945080B2 (en) 2016-11-18 2021-03-09 Stages Llc Audio analysis and processing system
US9980042B1 (en) 2016-11-18 2018-05-22 Stages Llc Beamformer direction of arrival and orientation analysis system
DK3477964T3 (da) 2017-10-27 2021-05-25 Oticon As Høresystem, der er konfigureret til at lokalisere en mållydkilde
EP3917160A1 (en) * 2020-05-27 2021-12-01 Nokia Technologies Oy Capturing content

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01158374A (ja) * 1987-12-16 1989-06-21 New Japan Radio Co Ltd ビデオカメラの被写体自動追尾装置
JPH09140000A (ja) * 1995-11-15 1997-05-27 Nippon Telegr & Teleph Corp <Ntt> 会議用拡聴器
JPH10276417A (ja) * 1997-03-31 1998-10-13 Matsushita Electric Works Ltd テレビ会議システム
JP2004064741A (ja) * 2002-06-05 2004-02-26 Fujitsu Ltd 移動端末用適応アンテナ装置
JP2004112701A (ja) * 2002-09-20 2004-04-08 Advanced Telecommunication Research Institute International マイクロホンアレー座標系の逐次的補正方法、マイクロホンアレーにおけるマイクロホン受信信号の補正方法および補正装置
JP2004109361A (ja) * 2002-09-17 2004-04-08 Toshiba Corp 指向性設定装置、指向性設定方法及び指向性設定プログラム
JP2006333069A (ja) * 2005-05-26 2006-12-07 Hitachi Ltd 移動体用アンテナ制御装置およびアンテナ制御方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6707487B1 (en) * 1998-11-20 2004-03-16 In The Play, Inc. Method for representing real-time motion
US8200775B2 (en) * 2005-02-01 2012-06-12 Newsilike Media Group, Inc Enhanced syndication

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01158374A (ja) * 1987-12-16 1989-06-21 New Japan Radio Co Ltd ビデオカメラの被写体自動追尾装置
JPH09140000A (ja) * 1995-11-15 1997-05-27 Nippon Telegr & Teleph Corp <Ntt> 会議用拡聴器
JPH10276417A (ja) * 1997-03-31 1998-10-13 Matsushita Electric Works Ltd テレビ会議システム
JP2004064741A (ja) * 2002-06-05 2004-02-26 Fujitsu Ltd 移動端末用適応アンテナ装置
JP2004109361A (ja) * 2002-09-17 2004-04-08 Toshiba Corp 指向性設定装置、指向性設定方法及び指向性設定プログラム
JP2004112701A (ja) * 2002-09-20 2004-04-08 Advanced Telecommunication Research Institute International マイクロホンアレー座標系の逐次的補正方法、マイクロホンアレーにおけるマイクロホン受信信号の補正方法および補正装置
JP2006333069A (ja) * 2005-05-26 2006-12-07 Hitachi Ltd 移動体用アンテナ制御装置およびアンテナ制御方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010161735A (ja) * 2009-01-09 2010-07-22 Xanavi Informatics Corp 音再生装置および音再生方法
JP2010212845A (ja) * 2009-03-09 2010-09-24 Yamaha Corp 音信号処理装置
JP2010283541A (ja) * 2009-06-03 2010-12-16 Fujitsu Ltd 携帯型無線通信装置およびその制御方法
KR20110064397A (ko) * 2009-12-08 2011-06-15 삼성전자주식회사 휴대용 단말기에서 블로우 방향을 인식하기 위한 장치 및 방법
KR101633380B1 (ko) * 2009-12-08 2016-06-24 삼성전자주식회사 휴대용 단말기에서 블로우 방향을 인식하기 위한 장치 및 방법
JP2011135489A (ja) * 2009-12-25 2011-07-07 Fujitsu Ltd マイクロホンの指向性制御装置
JP2014510430A (ja) * 2011-01-13 2014-04-24 クアルコム,インコーポレイテッド モバイルプラットフォームでの可変ビーム形成
US9066170B2 (en) 2011-01-13 2015-06-23 Qualcomm Incorporated Variable beamforming with a mobile platform
JP2015167408A (ja) * 2011-01-13 2015-09-24 クアルコム,インコーポレイテッド モバイルプラットフォームでの可変ビーム形成
JP2015173502A (ja) * 2011-02-23 2015-10-01 クゥアルコム・インコーポレイテッドQualcomm Incorporated 空間的選択音声拡張のためのシステム、方法、装置、およびコンピュータ可読媒体
JP2015194557A (ja) * 2014-03-31 2015-11-05 株式会社東芝 電子機器および電子機器の制御方法

Also Published As

Publication number Publication date
US8121310B2 (en) 2012-02-21
JP4799443B2 (ja) 2011-10-26
US20080199025A1 (en) 2008-08-21

Similar Documents

Publication Publication Date Title
JP4799443B2 (ja) 受音装置及びその方法
US11831812B2 (en) Conferencing device with beamforming and echo cancellation
US10979805B2 (en) Microphone array auto-directive adaptive wideband beamforming using orientation information from MEMS sensors
US9191738B2 (en) Sound enhancement method, device, program and recording medium
US10945080B2 (en) Audio analysis and processing system
US8981994B2 (en) Processing signals
US9591404B1 (en) Beamformer design using constrained convex optimization in three-dimensional space
EP3217653B1 (en) An apparatus
US10271135B2 (en) Apparatus for processing of audio signals based on device position
KR101566649B1 (ko) 근거리 널 및 빔 형성
KR101555416B1 (ko) 음향 삼각 측량에 의한 공간 선택적 사운드 취득 장치 및 방법
US9414159B2 (en) Beamforming pre-processing for speaker localization
US9020163B2 (en) Near-field null and beamforming
EP1349419A2 (en) Orthogonal circular microphone array system and method for detecting three-dimensional direction of sound source using the same
US20140093091A1 (en) System and method of detecting a user&#39;s voice activity using an accelerometer
TW200904226A (en) Enhanced beamforming for arrays of directional microphones
JP2001025082A (ja) マイクロホンアレイ装置
JPWO2004034734A1 (ja) アレイ装置および携帯端末
CN110140359B (zh) 使用波束形成的音频捕获
WO2015039439A1 (zh) 音频信号处理方法及装置、差分波束形成方法及装置
WO2014008253A1 (en) Systems and methods for surround sound echo reduction
JP2015520884A (ja) ユーザインターフェースを表示するためのシステムおよび方法
JP2011139378A (ja) 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
US20180146285A1 (en) Audio Gateway System
JP2010091912A (ja) 音声強調システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110705

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110802

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140812

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140812

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees