JP2001359185A - ハンズフリー装置とその音声信号処理方法 - Google Patents
ハンズフリー装置とその音声信号処理方法Info
- Publication number
- JP2001359185A JP2001359185A JP2000177089A JP2000177089A JP2001359185A JP 2001359185 A JP2001359185 A JP 2001359185A JP 2000177089 A JP2000177089 A JP 2000177089A JP 2000177089 A JP2000177089 A JP 2000177089A JP 2001359185 A JP2001359185 A JP 2001359185A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- hands
- free device
- phase
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
(57)【要約】
【課題】 話者の位置を特定し、音声入出力の指向性を
話者の方向に制御できるハンズフリー装置を提供する。 【解決手段】 複数個のマイク12と、各マイクに入力す
る音声信号の内から特定の話者15の音声信号を認識する
音声認識回路13と、マイクの各々に入力した話者の音声
信号から話者の方向を特定する方向特定手段14とを設
け、各マイクに入力した音声信号の内、特定の話者の音
声の位相及び振幅を検出し、この位相または振幅の情報
を基に、話者の方向を特定する。また、各マイクに入力
する音声信号の位相または振幅にウエイト付けをして音
声信号を加算することにより、話者の方向にマイクの指
向性を高める。騒音の大きい環境下でも、音声入力のS
/N比を高めることができる。
話者の方向に制御できるハンズフリー装置を提供する。 【解決手段】 複数個のマイク12と、各マイクに入力す
る音声信号の内から特定の話者15の音声信号を認識する
音声認識回路13と、マイクの各々に入力した話者の音声
信号から話者の方向を特定する方向特定手段14とを設
け、各マイクに入力した音声信号の内、特定の話者の音
声の位相及び振幅を検出し、この位相または振幅の情報
を基に、話者の方向を特定する。また、各マイクに入力
する音声信号の位相または振幅にウエイト付けをして音
声信号を加算することにより、話者の方向にマイクの指
向性を高める。騒音の大きい環境下でも、音声入力のS
/N比を高めることができる。
Description
【0001】
【発明の属する技術分野】本発明は、受話器、スピーカ
ーまたはマイクロフォンを手に持たずに音声を入力また
は出力するハンズフリー装置と、その音声信号の処理方
法に関し、特に、話者の方向に音声の入出力の指向性を
高めるようにしたものである。
ーまたはマイクロフォンを手に持たずに音声を入力また
は出力するハンズフリー装置と、その音声信号の処理方
法に関し、特に、話者の方向に音声の入出力の指向性を
高めるようにしたものである。
【0002】
【従来の技術】ハンズフリー装置は、スピーカーと、マ
イクロフォンとを備え、スピーカーまたはマイクロフォ
ンを手に持たずに音声を入力または出力するマン・マシ
ン・インターフェースである。
イクロフォンとを備え、スピーカーまたはマイクロフォ
ンを手に持たずに音声を入力または出力するマン・マシ
ン・インターフェースである。
【0003】従来のハンズフリー装置は、一般的に音声
入力及び音声出力の指向性を備えていない。音声入力の
指向性を考慮したものでは、特開平6−62103号公
報に記載されたハンズフリー装置が知られている。この
装置は、複数の指向性マイクロフォンと1つのスピーカ
とを備えており、例えば室内にいる複数の人の誰でも
が、この装置を使って相手先と通話できるように、各マ
イクロフォンの出力レベルを比較する比較部を持ち、出
力レベルが最大のマイクロフォンを選択して、そのマイ
クロフォンから入力した音声を電話機を通じて通話相手
先に送信するように構成されている。
入力及び音声出力の指向性を備えていない。音声入力の
指向性を考慮したものでは、特開平6−62103号公
報に記載されたハンズフリー装置が知られている。この
装置は、複数の指向性マイクロフォンと1つのスピーカ
とを備えており、例えば室内にいる複数の人の誰でも
が、この装置を使って相手先と通話できるように、各マ
イクロフォンの出力レベルを比較する比較部を持ち、出
力レベルが最大のマイクロフォンを選択して、そのマイ
クロフォンから入力した音声を電話機を通じて通話相手
先に送信するように構成されている。
【0004】
【発明が解決しようとする課題】しかし、この従来のハ
ンズフリー装置では、音声出力の指向性が無いため、ハ
ンズフリー装置からの音声出力が話者以外にも聞こえて
迷惑になるという問題点がある。また、話者が指向性マ
イクロフォンの一つに向き合う位置にいない場合には、
話者の音声をマイクロフォンで効果的に拾うことができ
ず、騒音の大きい環境下では、ハンズフリー装置への音
声入力のS/N比が悪くなるという問題点がある。
ンズフリー装置では、音声出力の指向性が無いため、ハ
ンズフリー装置からの音声出力が話者以外にも聞こえて
迷惑になるという問題点がある。また、話者が指向性マ
イクロフォンの一つに向き合う位置にいない場合には、
話者の音声をマイクロフォンで効果的に拾うことができ
ず、騒音の大きい環境下では、ハンズフリー装置への音
声入力のS/N比が悪くなるという問題点がある。
【0005】本発明は、こうした従来の問題点を解決す
るものであり、話者の位置を特定し、音声入出力の指向
性を話者の方向に制御できるハンズフリー装置を提供
し、また、このハンズフリー装置での音声信号の処理方
法を提供することを目的としている。
るものであり、話者の位置を特定し、音声入出力の指向
性を話者の方向に制御できるハンズフリー装置を提供
し、また、このハンズフリー装置での音声信号の処理方
法を提供することを目的としている。
【0006】
【課題を解決するための手段】そこで、本発明のハンズ
フリー装置では、複数個のマイクロフォンと、それぞれ
のマイクロフォンに入力する音声信号の内から特定の話
者の音声信号を認識する音声認識回路と、マイクロフォ
ンの各々に入力した話者の音声信号から話者の方向を特
定する方向特定手段とを設けている。
フリー装置では、複数個のマイクロフォンと、それぞれ
のマイクロフォンに入力する音声信号の内から特定の話
者の音声信号を認識する音声認識回路と、マイクロフォ
ンの各々に入力した話者の音声信号から話者の方向を特
定する方向特定手段とを設けている。
【0007】また、話者が携帯する電波発振器の電波を
受信する複数個の電波受信器と、電波受信器の各々で受
信した電波を基に電波発振器を携帯する話者の方向を特
定する方向特定手段とをハンズフリー装置に設けてい
る。
受信する複数個の電波受信器と、電波受信器の各々で受
信した電波を基に電波発振器を携帯する話者の方向を特
定する方向特定手段とをハンズフリー装置に設けてい
る。
【0008】また、本発明のハンズフリー装置での音声
信号処理方法では、ハンズフリー装置に複数個のマイク
ロフォンを設け、各マイクロフォンに入力した音声信号
の内、特定の話者の音声の位相及び振幅を検出し、この
位相または振幅の情報を基に、話者の方向を特定してい
る。
信号処理方法では、ハンズフリー装置に複数個のマイク
ロフォンを設け、各マイクロフォンに入力した音声信号
の内、特定の話者の音声の位相及び振幅を検出し、この
位相または振幅の情報を基に、話者の方向を特定してい
る。
【0009】また、ハンズフリー装置に複数個の電波受
信器を設け、話者に電波発振器を携帯させ、電波受信器
の各々で電波発振器からの信号の位相と振幅とを検出し
て、その位相または振幅の情報を基に電波発振器を携帯
する話者の方向を特定している。
信器を設け、話者に電波発振器を携帯させ、電波受信器
の各々で電波発振器からの信号の位相と振幅とを検出し
て、その位相または振幅の情報を基に電波発振器を携帯
する話者の方向を特定している。
【0010】また、ハンズフリー装置に複数個のスピー
カを設け、スピーカの音声出力の位相または振幅を制御
して、話者の方向にスピーカの指向性を高めるように制
御している。
カを設け、スピーカの音声出力の位相または振幅を制御
して、話者の方向にスピーカの指向性を高めるように制
御している。
【0011】また、ハンズフリー装置に複数個のマイク
ロフォンを設け、各マイクロフォンに入力する音声信号
の位相または振幅にウエイト付けをして、この音声信号
を加算することにより、話者の方向にマイクロフォンの
指向性を高めている。
ロフォンを設け、各マイクロフォンに入力する音声信号
の位相または振幅にウエイト付けをして、この音声信号
を加算することにより、話者の方向にマイクロフォンの
指向性を高めている。
【0012】そのため、話者の向きを特定し、スピーカ
の指向性やマイクロフォンの指向性を話者の方向に高め
ることができる。従って、音声出力が通話者以外には弱
くなるので、他者への迷惑を軽減することができ、ま
た、騒音の大きい環境下でもハンズフリー装置への音声
入力のS/N比を高めることができる。
の指向性やマイクロフォンの指向性を話者の方向に高め
ることができる。従って、音声出力が通話者以外には弱
くなるので、他者への迷惑を軽減することができ、ま
た、騒音の大きい環境下でもハンズフリー装置への音声
入力のS/N比を高めることができる。
【0013】
【発明の実施の形態】(第1の実施形態)第1の実施形
態のハンズフリー装置は、図1に示すように、複数個の
マイクロフォン12と、マイクロフォン12と対になる複数
個の音声認識回路13と、各音声認識回路13の認識結果に
基づいて話者の方向を特定する向き特定回路14とを備え
ている。
態のハンズフリー装置は、図1に示すように、複数個の
マイクロフォン12と、マイクロフォン12と対になる複数
個の音声認識回路13と、各音声認識回路13の認識結果に
基づいて話者の方向を特定する向き特定回路14とを備え
ている。
【0014】このハンズフリー装置11では、各マイクロ
フォン12から話者15の音声16が入力し、各音声認識回路
13が、各マイクロフォン12から入力する音声信号のう
ち、特定の話者の音声の位相と振幅とを検出する。向き
特定回路14は、各音声認識回路13で検出された位相の位
相差と振幅とから話者の方向を特定する。この方向は、
表示装置(不図示)で表示することもできる。
フォン12から話者15の音声16が入力し、各音声認識回路
13が、各マイクロフォン12から入力する音声信号のう
ち、特定の話者の音声の位相と振幅とを検出する。向き
特定回路14は、各音声認識回路13で検出された位相の位
相差と振幅とから話者の方向を特定する。この方向は、
表示装置(不図示)で表示することもできる。
【0015】各マイクロフォン12から入力した音声信号
は、加算して出力するが、このとき、マイクロフォンの
総合特性が話者の方向に指向性を持つように、この加算
を制御する。この点については第3の実施形態で詳述す
る。また、図1では図示していないが、ハンズフリー装
置に複数のスピーカを設け、このスピーカの総合的な指
向性が話者の方向に向くように、各スピーカの音声出力
の位相と振幅とを制御する。この点については第4の実
施形態で詳しく説明する。
は、加算して出力するが、このとき、マイクロフォンの
総合特性が話者の方向に指向性を持つように、この加算
を制御する。この点については第3の実施形態で詳述す
る。また、図1では図示していないが、ハンズフリー装
置に複数のスピーカを設け、このスピーカの総合的な指
向性が話者の方向に向くように、各スピーカの音声出力
の位相と振幅とを制御する。この点については第4の実
施形態で詳しく説明する。
【0016】ここでは、各マイクロフォン12から入力す
る音声信号を基に話者の方向を特定する原理について説
明する。
る音声信号を基に話者の方向を特定する原理について説
明する。
【0017】いま、図2に示すように、4つのマイクロ
フォンA21、B22、C23、D24が座標軸(x、y軸)上
に配置され、各マイクロフォンの原点oからの距離がd
であるとする。
フォンA21、B22、C23、D24が座標軸(x、y軸)上
に配置され、各マイクロフォンの原点oからの距離がd
であるとする。
【0018】また、ハンズフリー装置に話者の音声が入
射する向き25とx軸とがなす角をθとする。
射する向き25とx軸とがなす角をθとする。
【0019】各マイクロフォンA21、B22、C23、D24
から入力した音声信号のうち、各マイクロフォンと対を
なす各音声認識回路によって検出された話者の音声の位
相φA、φB、φC、φDは、それぞれ、 φA = 2πd×cos(θ)/λ (1−a) φB = 2πd×sin(θ)/λ (1−b) φC = -2πd×cos(θ)/λ (1−c) φD = -2πd×sin(θ)/λ (1−d) となる。ここで、λは検出した話者の音声の波長であ
る。また、位相は原点で検出される位相を基準にしてい
る。これらの式を整理すると、 cos(θ) = (φA -φC)×λ/4πd (2−a) sin(θ) = (φB -φD)×λ/4πd (2−b) と表せる。ここで、話者の音声の波長λは既知で、長さ
dもマイクロフォンの配置から既知であるので、位相φ
A、φB、φC、φDを検出すれば、式(2−a)、(2−
b)から話者の音声が入射する向きθを一意に特定する
ことができる。
から入力した音声信号のうち、各マイクロフォンと対を
なす各音声認識回路によって検出された話者の音声の位
相φA、φB、φC、φDは、それぞれ、 φA = 2πd×cos(θ)/λ (1−a) φB = 2πd×sin(θ)/λ (1−b) φC = -2πd×cos(θ)/λ (1−c) φD = -2πd×sin(θ)/λ (1−d) となる。ここで、λは検出した話者の音声の波長であ
る。また、位相は原点で検出される位相を基準にしてい
る。これらの式を整理すると、 cos(θ) = (φA -φC)×λ/4πd (2−a) sin(θ) = (φB -φD)×λ/4πd (2−b) と表せる。ここで、話者の音声の波長λは既知で、長さ
dもマイクロフォンの配置から既知であるので、位相φ
A、φB、φC、φDを検出すれば、式(2−a)、(2−
b)から話者の音声が入射する向きθを一意に特定する
ことができる。
【0020】例えば、cos(θ)=1.0、sin(θ)=0.
0という組みに対してはθ=0度であり、他の解はな
い。
0という組みに対してはθ=0度であり、他の解はな
い。
【0021】図3は、式(2−a)、(2−b)の関係
を表したグラフである。あるcos(θ)とsin(θ)との値の
組みを満たすθの値は2πの整数倍を除いて1つしか無
い。従って、式(2−a)、(2−b)の関係から、音
声の入射方向θを一意に特定できることが明らかであ
る。
を表したグラフである。あるcos(θ)とsin(θ)との値の
組みを満たすθの値は2πの整数倍を除いて1つしか無
い。従って、式(2−a)、(2−b)の関係から、音
声の入射方向θを一意に特定できることが明らかであ
る。
【0022】ここでは、簡単のためにマイクロフォンの
数を4つとし、検出した位相情報のみ利用する例を挙げ
たが、さらにマイクロフォンの数を増減したり、位相だ
けでなく、振幅の情報を利用して、各マイクロフォンに
入力する音声信号の振幅の差分から話者の方向を特定す
ることもできる。
数を4つとし、検出した位相情報のみ利用する例を挙げ
たが、さらにマイクロフォンの数を増減したり、位相だ
けでなく、振幅の情報を利用して、各マイクロフォンに
入力する音声信号の振幅の差分から話者の方向を特定す
ることもできる。
【0023】このように、ハンズフリー装置に複数のマ
イクロフォンを設け、各マイクロフォンから入力した音
声信号の内、特定の話者の音声の位相差と振幅とを検出
することにより、話者の方向を特定することが可能にな
る。
イクロフォンを設け、各マイクロフォンから入力した音
声信号の内、特定の話者の音声の位相差と振幅とを検出
することにより、話者の方向を特定することが可能にな
る。
【0024】また、この方法で数秒に一回程度話者の方
向を検出し続ければ、話者15が動き回っても、実用上支
障なく、話者の動きまわる速さに十分追随して方向を特
定し続けることができる。
向を検出し続ければ、話者15が動き回っても、実用上支
障なく、話者の動きまわる速さに十分追随して方向を特
定し続けることができる。
【0025】(第2の実施形態)第2の実施形態では、
ハンズフリー装置において、話者の方向を特定するため
の別の仕組みについて説明する。
ハンズフリー装置において、話者の方向を特定するため
の別の仕組みについて説明する。
【0026】この装置は、図4に示すように、複数個の
電波受信器42を備えており、また、話者15は、波長λの
電波44を出力する電波発振器43を保持している。また、
図4では図示していないが、複数の電波受信器42の受信
情報から、電波発振器43の方向を特定する方向特定手段
を有している。
電波受信器42を備えており、また、話者15は、波長λの
電波44を出力する電波発振器43を保持している。また、
図4では図示していないが、複数の電波受信器42の受信
情報から、電波発振器43の方向を特定する方向特定手段
を有している。
【0027】この装置では、電波受信器42に入力する電
波の位相と振幅との情報を基に電波発振器43の方向、即
ち、話者の方向を特定することができる。また、表示装
置(不図示)で、この方向を表示することもできる。
波の位相と振幅との情報を基に電波発振器43の方向、即
ち、話者の方向を特定することができる。また、表示装
置(不図示)で、この方向を表示することもできる。
【0028】この場合に、電波受信器で受信する情報か
ら話者の方向を特定する原理について、図5を用いて説
明する。
ら話者の方向を特定する原理について、図5を用いて説
明する。
【0029】図5では、4つの電波受信器A51、B52、
C53、D54が座標軸(x、y軸)上に配置されており、
各電波受信器の原点oからの距離がdであるとする。
C53、D54が座標軸(x、y軸)上に配置されており、
各電波受信器の原点oからの距離がdであるとする。
【0030】また、このハンズフリー装置に電波44が入
射する向き55とx軸とのなす角をθとする。
射する向き55とx軸とのなす角をθとする。
【0031】それぞれの電波受信器A51、B52、C53、
D54で検出された電波の位相φA、φB、φC、φDは、そ
れぞれ、 φA = 2πd×cos(θ)/λ (3−a) φB = 2πd×sin(θ)/λ (3−b) φC = -2πd×cos(θ)/λ (3−c) φD = -2πd×sin(θ)/λ (3−d) となる。ここで、位相は原点で検出される位相を基準に
している。これらの式を整理すると、 cos(θ) = (φA -φC)×λ/4πd (4−a) sin(θ) = (φB -φD)×λ/4πd (4−b) と表せる。ここで、電波発振器43からの電波の波長λは
既知であり、長さdも電波受信器の配置から既知であ
る。上記式(3)、(4)は式(1)、(2)と同じ形
をしており、第1の実施形態のハンズフリー装置と同様
に、位相φA、φB、φC、φDを検出すれば、式(4−
a)、(4−b)から電波発振器の電波が入射する方向
θを一意に特定することができる。
D54で検出された電波の位相φA、φB、φC、φDは、そ
れぞれ、 φA = 2πd×cos(θ)/λ (3−a) φB = 2πd×sin(θ)/λ (3−b) φC = -2πd×cos(θ)/λ (3−c) φD = -2πd×sin(θ)/λ (3−d) となる。ここで、位相は原点で検出される位相を基準に
している。これらの式を整理すると、 cos(θ) = (φA -φC)×λ/4πd (4−a) sin(θ) = (φB -φD)×λ/4πd (4−b) と表せる。ここで、電波発振器43からの電波の波長λは
既知であり、長さdも電波受信器の配置から既知であ
る。上記式(3)、(4)は式(1)、(2)と同じ形
をしており、第1の実施形態のハンズフリー装置と同様
に、位相φA、φB、φC、φDを検出すれば、式(4−
a)、(4−b)から電波発振器の電波が入射する方向
θを一意に特定することができる。
【0032】ここでは、簡単のために電波受信器の数を
4つとし、検出した位相情報のみ利用する例を挙げた
が、さらに電波受信器の数を増減したり、位相だけでな
く、振幅の情報を利用し、各電波受信器に入力する電波
の振幅の差分から電波の入射方向を特定することもでき
る。
4つとし、検出した位相情報のみ利用する例を挙げた
が、さらに電波受信器の数を増減したり、位相だけでな
く、振幅の情報を利用し、各電波受信器に入力する電波
の振幅の差分から電波の入射方向を特定することもでき
る。
【0033】この電波発振器43を話者15に携帯させれ
ば、話者15の方向を特定することができる。電波発振器
43が数秒に一回程度発振し、電波受信器42がそれに同期
していれば、電波発振器43が連続発振していなくても、
話者15の動きまわる速さに追随して、実用上支障なく、
話者の方向を特定することができる。
ば、話者15の方向を特定することができる。電波発振器
43が数秒に一回程度発振し、電波受信器42がそれに同期
していれば、電波発振器43が連続発振していなくても、
話者15の動きまわる速さに追随して、実用上支障なく、
話者の方向を特定することができる。
【0034】(第3の実施形態)第3の実施形態では、
特定した話者の方向にスピーカの指向性を高めるための
構成について説明する。
特定した話者の方向にスピーカの指向性を高めるための
構成について説明する。
【0035】このハンズフリー装置は、図6に示すよう
に、第1または第2の実施形態の構成に加えて、複数個
のスピーカ61を備えている。また、図6には示していな
いが、各スピーカ61の音声出力の位相や振幅を制御する
制御手段を有している。
に、第1または第2の実施形態の構成に加えて、複数個
のスピーカ61を備えている。また、図6には示していな
いが、各スピーカ61の音声出力の位相や振幅を制御する
制御手段を有している。
【0036】この装置では、スピーカ61の音声出力62の
位相と振幅とを制御して、ハンズフリー装置11のスピー
カ61の指向性を、特定した話者15の方向に高めている。
位相と振幅とを制御して、ハンズフリー装置11のスピー
カ61の指向性を、特定した話者15の方向に高めている。
【0037】この場合に、特定した方向に音声出力の指
向性を高めることができる原理について、図7、図8及
び図9を用いて説明する。
向性を高めることができる原理について、図7、図8及
び図9を用いて説明する。
【0038】いま、図7に示すように、4つのスピーカ
A71、B72、C73、D74が座標軸(x、y軸)上に配置
されており、各スピーカの原点oからの距離がdoutで
あるとする。また、指向性を高めたい向き75とx軸との
なす角をθとする。各スピーカーは無指向性のものを使
用する。
A71、B72、C73、D74が座標軸(x、y軸)上に配置
されており、各スピーカの原点oからの距離がdoutで
あるとする。また、指向性を高めたい向き75とx軸との
なす角をθとする。各スピーカーは無指向性のものを使
用する。
【0039】それぞれのスピーカA71、B72、C73、D
74から出力される音声の位相をφAout、φBout、φCou
t、φDoutとする。一般にθの向きに指向性を高めたい
場合には、例えば、 φAout =−2πdout×cos(θ)/λout (5−a) φBout =−2πdout×sin(θ)/λout (5−b) φCout = 2πdout×cos(θ)/λout (5−c) φDout = 2πdout×sin(θ)/λout (5−d) とし、各スピーカから出力される音声の振幅を同じにす
ればよい。ここでλoutは出力音声の波長である。例え
ば、dout/λout=0.25のとき、θ=0度の向きに
指向性を高めたい場合には、 φAout =−90度 (6−a) φBout = 0度 (6−b) φCout = 90度 (6−c) φDout = 0度 (6−d) とし、各スピーカから出力される音声の振幅を同じにす
ればよい。このときの音声出力強度のレーダーチャート
を図8に示す。θ=0度の向きには各スピーカからの音
声出力の位相が揃って強め合い、他の向きでは弱め合う
ことが分かる。同様に、例えば、dout/λout=0.2
5のときθ=30度の向きに指向性を高めたい場合に
は、 φAout =−77.94度 (7−a) φBout =−45.00度 (7−b) φCout = 77.94度 (7−c) φDout = 45.00度 (7−d) とし、各スピーカから出力される音声の振幅を同じにす
ればよい。このときの音声出力強度のレーダーチャート
を図9に示す。θ=30度の向きには各スピーカからの
音声出力の位相が揃って強め合い、他の向きでは弱め合
うことが分かる。ここでは、簡単のためにスピーカの数
は4つで、位相のみを制御する例を挙げたが、さらにス
ピーカの数を増減したり、位相だけでなく振幅も制御す
ることもできる。
74から出力される音声の位相をφAout、φBout、φCou
t、φDoutとする。一般にθの向きに指向性を高めたい
場合には、例えば、 φAout =−2πdout×cos(θ)/λout (5−a) φBout =−2πdout×sin(θ)/λout (5−b) φCout = 2πdout×cos(θ)/λout (5−c) φDout = 2πdout×sin(θ)/λout (5−d) とし、各スピーカから出力される音声の振幅を同じにす
ればよい。ここでλoutは出力音声の波長である。例え
ば、dout/λout=0.25のとき、θ=0度の向きに
指向性を高めたい場合には、 φAout =−90度 (6−a) φBout = 0度 (6−b) φCout = 90度 (6−c) φDout = 0度 (6−d) とし、各スピーカから出力される音声の振幅を同じにす
ればよい。このときの音声出力強度のレーダーチャート
を図8に示す。θ=0度の向きには各スピーカからの音
声出力の位相が揃って強め合い、他の向きでは弱め合う
ことが分かる。同様に、例えば、dout/λout=0.2
5のときθ=30度の向きに指向性を高めたい場合に
は、 φAout =−77.94度 (7−a) φBout =−45.00度 (7−b) φCout = 77.94度 (7−c) φDout = 45.00度 (7−d) とし、各スピーカから出力される音声の振幅を同じにす
ればよい。このときの音声出力強度のレーダーチャート
を図9に示す。θ=30度の向きには各スピーカからの
音声出力の位相が揃って強め合い、他の向きでは弱め合
うことが分かる。ここでは、簡単のためにスピーカの数
は4つで、位相のみを制御する例を挙げたが、さらにス
ピーカの数を増減したり、位相だけでなく振幅も制御す
ることもできる。
【0040】このように、ハンズフリー装置に複数のス
ピーカを設け、このスピーカの音声出力の位相と振幅と
を制御することにより、ハンズフリー装置11からの音声
出力62に、特定の方向だけの高い指向性を持たせること
ができる。そのため、話者15以外は、ハンズフリー装置
11から届く音声が弱くなるので、他人の迷惑を軽減する
ことができる。
ピーカを設け、このスピーカの音声出力の位相と振幅と
を制御することにより、ハンズフリー装置11からの音声
出力62に、特定の方向だけの高い指向性を持たせること
ができる。そのため、話者15以外は、ハンズフリー装置
11から届く音声が弱くなるので、他人の迷惑を軽減する
ことができる。
【0041】(第4の実施形態)第4の実施形態では、
特定した話者の方向にマイクロフォンの指向性を高める
方式について説明する。
特定した話者の方向にマイクロフォンの指向性を高める
方式について説明する。
【0042】このハンズフリー装置は、図10に示すよ
うに、第1または第2の実施形態の構成に加えて、さら
に、マイクロフォン12の音声入力に位相及び振幅のウエ
イト付けをする乗算器と、ウエイト付けされたそれぞれ
の音声信号を加算する加算器とを有している。
うに、第1または第2の実施形態の構成に加えて、さら
に、マイクロフォン12の音声入力に位相及び振幅のウエ
イト付けをする乗算器と、ウエイト付けされたそれぞれ
の音声信号を加算する加算器とを有している。
【0043】このハンズフリー装置11では、それぞれの
マイクロフォン12から入力する音声信号に対して乗算器
で重みが乗算され、各乗算器の出力が加算器で加算され
る。こうした構成によって、第1または第2の実施形態
の方式で特定した方向にハンズフリー装置11のマイクロ
フォンの指向性を高めることができる。
マイクロフォン12から入力する音声信号に対して乗算器
で重みが乗算され、各乗算器の出力が加算器で加算され
る。こうした構成によって、第1または第2の実施形態
の方式で特定した方向にハンズフリー装置11のマイクロ
フォンの指向性を高めることができる。
【0044】例えば、図11に示すように、4つのマイ
クロフォンA111、B112、C113、D114が座標軸(x、
y軸)上に配置されており、各マイクロフォンの原点o
からの距離がdinであるとする。また、指向性を高めた
い向き115とx軸とのなす角をθとする。各マイクロフ
ォンは無指向性のものを使用する。
クロフォンA111、B112、C113、D114が座標軸(x、
y軸)上に配置されており、各マイクロフォンの原点o
からの距離がdinであるとする。また、指向性を高めた
い向き115とx軸とのなす角をθとする。各マイクロフ
ォンは無指向性のものを使用する。
【0045】このとき、各マイクロフォンから入力され
る音声信号の振幅は変えずに、音声信号の位相をそれぞ
れ、 φAin =−2πdin×cos(θ)/λin (8−a) φBin =−2πdin×sin(θ)/λin (8−b) φCin = 2πdin×cos(θ)/λin (8−c) φDin = 2πdin×sin(θ)/λin (8−d) だけずらして加算すればθの方向の指向性を高めること
ができる。ここで、φAin、φBin、φCin、φDinは、そ
れぞれ、マイクロフォンA111、B112、C113、D114か
ら入力される音声信号に設定する位相であり、λinは入
力音声の波長である。このときの音声入力に対するマイ
クロフォンの感度は、図8(θ=0度の場合)及び図9
(θ=30度の場合)と全く同様になる。
る音声信号の振幅は変えずに、音声信号の位相をそれぞ
れ、 φAin =−2πdin×cos(θ)/λin (8−a) φBin =−2πdin×sin(θ)/λin (8−b) φCin = 2πdin×cos(θ)/λin (8−c) φDin = 2πdin×sin(θ)/λin (8−d) だけずらして加算すればθの方向の指向性を高めること
ができる。ここで、φAin、φBin、φCin、φDinは、そ
れぞれ、マイクロフォンA111、B112、C113、D114か
ら入力される音声信号に設定する位相であり、λinは入
力音声の波長である。このときの音声入力に対するマイ
クロフォンの感度は、図8(θ=0度の場合)及び図9
(θ=30度の場合)と全く同様になる。
【0046】従って、各マイクロフォンから入力される
音声信号の位相がφAin、φBin、φCin、φDinとなるよ
うに乗算器でウエイト付けを行い、その音声信号を加算
器で加算することにより、マイクロフォンのθ方向の感
度を高めることができる。
音声信号の位相がφAin、φBin、φCin、φDinとなるよ
うに乗算器でウエイト付けを行い、その音声信号を加算
器で加算することにより、マイクロフォンのθ方向の感
度を高めることができる。
【0047】ここでは、簡単のためにマイクロフォンの
数を4つとし、位相のみウエイトづけする例を挙げた
が、さらにマイクロフォンの数を増減したり、位相だけ
でなく振幅もウエイトづけすることもできる。
数を4つとし、位相のみウエイトづけする例を挙げた
が、さらにマイクロフォンの数を増減したり、位相だけ
でなく振幅もウエイトづけすることもできる。
【0048】このように、このハンズフリー装置11で
は、特定した方向に音声入力の指向性を高めることがで
きる。そのため、騒音の大きい環境下でもハンズフリー
装置への音声入力のS/N比が悪くならない。
は、特定した方向に音声入力の指向性を高めることがで
きる。そのため、騒音の大きい環境下でもハンズフリー
装置への音声入力のS/N比が悪くならない。
【0049】なお、本発明のハンズフリー装置は、話者
の方向を特定して、音声出力の指向性だけをその方向に
高めるもの、または、音声入力の指向性だけをその方向
に高めるものであっても良く、また、音声出力の指向性
と音声入力の指向性とを、共にその方向に高めるもので
あっても良い。
の方向を特定して、音声出力の指向性だけをその方向に
高めるもの、または、音声入力の指向性だけをその方向
に高めるものであっても良く、また、音声出力の指向性
と音声入力の指向性とを、共にその方向に高めるもので
あっても良い。
【0050】
【発明の効果】以上の説明から明らかなように、本発明
のハンズフリー装置、及び、その音声信号の処理方法で
は、話者の方向を特定することができ、また、特定した
話者の方向にスピーカの指向性を高めることができる。
のハンズフリー装置、及び、その音声信号の処理方法で
は、話者の方向を特定することができ、また、特定した
話者の方向にスピーカの指向性を高めることができる。
【0051】そのため、ハンズフリー装置からの音声出
力が話者以外には弱くなるので、他者への迷惑を軽減す
ることができる。
力が話者以外には弱くなるので、他者への迷惑を軽減す
ることができる。
【0052】また、話者の方向を特定し、その方向にマ
イクロフォンの指向性を高めることができる。
イクロフォンの指向性を高めることができる。
【0053】そのため、騒音の大きい環境下でもハンズ
フリー装置への音声入力のS/N比が悪くならない。
フリー装置への音声入力のS/N比が悪くならない。
【図1】本発明の第1の実施形態を説明する図、
【図2】本発明の第1の実施形態における方向特定の原
理を説明する図、
理を説明する図、
【図3】sin(θ)、cos(θ)のグラフ、
【図4】本発明の第2の実施形態を説明する図、
【図5】本発明の第2の実施形態における方向特定の原
理を説明する図、
理を説明する図、
【図6】本発明の第3の実施形態を説明する図、
【図7】本発明の第3の実施形態における特定した方向
に音声出力の指向性を高める原理を説明する図、
に音声出力の指向性を高める原理を説明する図、
【図8】θ=0度の場合の音声出力強度のレーダーチャ
ート図、
ート図、
【図9】θ=30度の場合の音声出力強度のレーダーチ
ャート図、
ャート図、
【図10】本発明の第4の実施形態を説明する図、
【図11】本発明の第4の実施形態における特定した方
向に音声入力の指向性を高める原理を説明する図であ
る。
向に音声入力の指向性を高める原理を説明する図であ
る。
11 ハンズフリー装置 12 マイクロフォン 13 音声認識回路 14 向き特定回路 15 話者 16 音声 21 マイクロフォンA 22 マイクロフォンB 23 マイクロフォンC 24 マイクロフォンD 25 話者の音声の入射する向き 42 電波受信器 43 電波発振器 44 電波 51 電波受信器A 52 電波受信器B 53 電波受信器C 54 電波受信器D 55 電波の入射する向き 61 スピーカ 62 音声出力 71 スピーカA 72 スピーカB 73 スピーカC 74 スピーカD 75 指向性を高めたい向き 111 マイクロフォンA 112 マイクロフォンB 113 マイクロフォンC 114 マイクロフォンD 115 指向性を高めたい向き
Claims (8)
- 【請求項1】 複数個のマイクロフォンと、それぞれの
マイクロフォンに入力する音声信号の内から特定の話者
の音声信号を認識する音声認識回路と、前記マイクロフ
ォンの各々に入力した前記話者の音声信号から前記話者
の方向を特定する方向特定手段とを備えることを特徴と
するハンズフリー装置。 - 【請求項2】 話者が携帯する電波発振器の電波を受信
する複数個の電波受信器と、前記電波受信器の各々で受
信した電波を基に前記電波発振器を携帯する話者の方向
を特定する方向特定手段とを備えることを特徴とするハ
ンズフリー装置。 - 【請求項3】 複数個のスピーカと、前記スピーカの音
声出力の位相または振幅を制御する制御手段とを備え、
前記話者の方向にスピーカの指向性を高めることを特徴
とする請求項1または2に記載のハンズフリー装置。 - 【請求項4】 複数個のマイクロフォンの各々に入力す
る音声信号の位相または振幅に重み付けする重み付け手
段と、重み付けした前記音声信号を加算する加算手段と
を備えることを特徴とする請求項1、2または3に記載
のハンズフリー装置。 - 【請求項5】 ハンズフリー装置に複数個のマイクロフ
ォンを設け、各マイクロフォンに入力した音声信号の
内、特定の話者の音声の位相及び振幅を検出し、前記位
相または振幅の情報を基に、前記話者の方向を特定する
ことを特徴とするハンズフリー装置での音声信号処理方
法。 - 【請求項6】 ハンズフリー装置に複数個の電波受信器
を設け、話者に電波発振器を携帯させ、前記電波受信器
の各々で前記電波発振器からの信号の位相と振幅とを検
出して、その位相または振幅の情報を基に電波発振器を
携帯する話者の方向を特定することを特徴とするハンズ
フリー装置での音声信号処理方法。 - 【請求項7】 ハンズフリー装置に複数個のスピーカを
設け、前記スピーカの音声出力の位相または振幅を制御
して、話者の方向にスピーカの指向性を高めることを特
徴とするハンズフリー装置での音声信号処理方法。 - 【請求項8】 ハンズフリー装置に複数個のマイクロフ
ォンを設け、各マイクロフォンに入力する音声信号の位
相または振幅にウエイト付けをして、前記音声信号を加
算することにより、話者の方向にマイクロフォンの指向
性を高めることを特徴とするハンズフリー装置での音声
信号処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000177089A JP2001359185A (ja) | 2000-06-13 | 2000-06-13 | ハンズフリー装置とその音声信号処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000177089A JP2001359185A (ja) | 2000-06-13 | 2000-06-13 | ハンズフリー装置とその音声信号処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001359185A true JP2001359185A (ja) | 2001-12-26 |
Family
ID=18678731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000177089A Pending JP2001359185A (ja) | 2000-06-13 | 2000-06-13 | ハンズフリー装置とその音声信号処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001359185A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004038695A1 (en) * | 2002-10-25 | 2004-05-06 | Motorola Inc | Directional speech recognition device and method |
JP2006304124A (ja) * | 2005-04-25 | 2006-11-02 | V-Cube Inc | 音源方向確定装置および音源方向確定方法 |
JP2007194677A (ja) * | 2006-01-16 | 2007-08-02 | Tokai Univ | 光マイクロホン |
JP2007266754A (ja) * | 2006-03-27 | 2007-10-11 | Denso Corp | 車両用音声入出力装置および音声入出力装置用プログラム |
JP2008177745A (ja) * | 2007-01-17 | 2008-07-31 | Yamaha Corp | 放収音システム |
JP2009021657A (ja) * | 2007-07-10 | 2009-01-29 | Yamaha Corp | 放収音装置、および放収音システム |
JP2013083751A (ja) * | 2011-10-07 | 2013-05-09 | Denso Corp | 車両用装置 |
JP2018019413A (ja) * | 2014-06-30 | 2018-02-01 | チンタオ ゴーアテック テクノロジー カンパニー リミテッドQingdao Goertek Technology Co., Ltd. | ハンズフリー通話機器の通話品質を向上させる方法、装置及びハンズフリー通話機器 |
KR20190016851A (ko) * | 2017-08-09 | 2019-02-19 | 에스케이텔레콤 주식회사 | 음성 인식 방법 및 이에 사용되는 장치 |
CN111883167A (zh) * | 2020-08-12 | 2020-11-03 | 上海明略人工智能(集团)有限公司 | 声音的分离方法及装置、录音设备、可读存储介质 |
-
2000
- 2000-06-13 JP JP2000177089A patent/JP2001359185A/ja active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004038695A1 (en) * | 2002-10-25 | 2004-05-06 | Motorola Inc | Directional speech recognition device and method |
JP2006304124A (ja) * | 2005-04-25 | 2006-11-02 | V-Cube Inc | 音源方向確定装置および音源方向確定方法 |
JP4754360B2 (ja) * | 2006-01-16 | 2011-08-24 | 学校法人東海大学 | 光マイクロホン |
JP2007194677A (ja) * | 2006-01-16 | 2007-08-02 | Tokai Univ | 光マイクロホン |
JP2007266754A (ja) * | 2006-03-27 | 2007-10-11 | Denso Corp | 車両用音声入出力装置および音声入出力装置用プログラム |
JP2008177745A (ja) * | 2007-01-17 | 2008-07-31 | Yamaha Corp | 放収音システム |
JP2009021657A (ja) * | 2007-07-10 | 2009-01-29 | Yamaha Corp | 放収音装置、および放収音システム |
JP2013083751A (ja) * | 2011-10-07 | 2013-05-09 | Denso Corp | 車両用装置 |
US8885847B2 (en) | 2011-10-07 | 2014-11-11 | Denso Corporation | Vehicular apparatus |
JP2018019413A (ja) * | 2014-06-30 | 2018-02-01 | チンタオ ゴーアテック テクノロジー カンパニー リミテッドQingdao Goertek Technology Co., Ltd. | ハンズフリー通話機器の通話品質を向上させる方法、装置及びハンズフリー通話機器 |
KR20190016851A (ko) * | 2017-08-09 | 2019-02-19 | 에스케이텔레콤 주식회사 | 음성 인식 방법 및 이에 사용되는 장치 |
KR20210148057A (ko) * | 2017-08-09 | 2021-12-07 | 에스케이텔레콤 주식회사 | 음성 인식 방법 및 이에 사용되는 장치 |
KR102372327B1 (ko) * | 2017-08-09 | 2022-03-08 | 에스케이텔레콤 주식회사 | 음성 인식 방법 및 이에 사용되는 장치 |
KR102374054B1 (ko) | 2017-08-09 | 2022-03-14 | 에스케이텔레콤 주식회사 | 음성 인식 방법 및 이에 사용되는 장치 |
CN111883167A (zh) * | 2020-08-12 | 2020-11-03 | 上海明略人工智能(集团)有限公司 | 声音的分离方法及装置、录音设备、可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3122066B1 (en) | Audio enhancement via opportunistic use of microphones | |
JP4799443B2 (ja) | 受音装置及びその方法 | |
JP4348706B2 (ja) | アレイ装置および携帯端末 | |
EP3550853B1 (en) | Apparatus for processing audio signals | |
US9525938B2 (en) | User voice location estimation for adjusting portable device beamforming settings | |
EP1489596B1 (en) | Device and method for voice activity detection | |
KR101715779B1 (ko) | 음원 신호 처리 장치 및 그 방법 | |
US10015589B1 (en) | Controlling speech enhancement algorithms using near-field spatial statistics | |
JP4725643B2 (ja) | 音波出力装置、通話装置、音波出力方法、及びプログラム | |
US9521486B1 (en) | Frequency based beamforming | |
CN102324237A (zh) | 麦克风阵列语音波束形成方法、语音信号处理装置及系统 | |
EP1501332A2 (en) | A method to reduce acoustic coupling in audio conferencing systems | |
Karbasi et al. | A new DOA estimation method using a circular microphone array | |
JP2001359185A (ja) | ハンズフリー装置とその音声信号処理方法 | |
CN110830870B (zh) | 一种基于传声器技术的耳机佩戴者语音活动检测系统 | |
Ayllón et al. | Indoor blind localization of smartphones by means of sensor data fusion | |
US9443531B2 (en) | Single MIC detection in beamformer and noise canceller for speech enhancement | |
CN110517704B (zh) | 一种基于麦克风阵列波束形成算法的语音处理系统 | |
US20220351742A1 (en) | Adaptive noise cancelling for conferencing communication systems | |
Li et al. | Reverberation robust feature extraction for sound source localization using a small-sized microphone array | |
KR102306066B1 (ko) | 집음 방법, 장치 및 매체 | |
US10313786B1 (en) | Beamforming and gainsharing mixing of small circular array of bidirectional microphones | |
JP2001359187A (ja) | ハンズフリー装置および方法 | |
JP2011066805A (ja) | 収音装置および収音方法 | |
Levin et al. | Robust beamforming using sensors with nonidentical directivity patterns |