JP2000221999A - 雑音除去機能付き音声入力装置及び音声入出力装置 - Google Patents

雑音除去機能付き音声入力装置及び音声入出力装置

Info

Publication number
JP2000221999A
JP2000221999A JP11021308A JP2130899A JP2000221999A JP 2000221999 A JP2000221999 A JP 2000221999A JP 11021308 A JP11021308 A JP 11021308A JP 2130899 A JP2130899 A JP 2130899A JP 2000221999 A JP2000221999 A JP 2000221999A
Authority
JP
Japan
Prior art keywords
microphones
microphone
noise
plane
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11021308A
Other languages
English (en)
Inventor
Yasuyuki Masai
康之 正井
Tomohiro Onoki
智宏 小野木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP11021308A priority Critical patent/JP2000221999A/ja
Publication of JP2000221999A publication Critical patent/JP2000221999A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】マイクロホンと話者の位置関係を話者に意識さ
せずに制限できるようにすることにより、雑音除去機能
を有効に作用させる。 【解決手段】音声を入力するための2本のマイク101
及び102と、当該マイク101及び102により入力
された音声に含まれる雑音を除去するためのビームフォ
ーマ型雑音除去部104とを備えた雑音除去機能付き音
声入力装置において、上記2本のマイク101及び10
2が面対称となる平面X上に疑似マイク103を設けた
ことを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、少なくとも2本の
マイクロホンを有する雑音除去機能付き音声入力装置及
び音声入出力装置に関する。
【0002】
【従来の技術】音声認識装置やテレビ会議装置などの音
声入力を必要とする装置に音声を入力する際、騒音や他
の声などの雑音が混入してしまうと装置の性能が著しく
低下することが知られている。
【0003】そこで、これを解決するための、雑音や複
数の音源から目的音だけを抽出する方法として (イ)目的音に雑音が重畳した主入力と雑音のみの参照
大力を用い、適応フィルタによって主入力の雑音を参照
入力から推定し、主入力から減算する方法 (ロ)目的音が入力されていない雑音だけのときか、ま
たは別途雑音のみの参照入力から雑音の周波数成分を求
め、雑音の重畳した目的音の周波数成分から雑音の周波
数成分を減算する方法(スペクトルサブトラクション) (ハ)複数のマイクを用い、目的音の方向に指向性を集
中することによって目的音以外の方向の雑音を抑圧する
方法(ビームフォーマ)などが従来から用いられてき
た。
【0004】上記(イ)、(ロ)の方法は、目的音の入
力に1つのマイクロホンを用いており、且つ参照入力に
目的音が混入しない位置でなければならないため、入力
可能な位置・方向に関してかなりの制約を受ける。
【0005】一方、上記(ハ)の方法は、複数のマイク
ロホンを用いて指向性を制御するため、ユーザ(話者)
の音声入力可能な方向は上記(イ)、(ロ)に比べると
広くなる。但し、目的音方向と雑音方向を区別する必要
があるため、目的音の入力可能な方向は単一の方向かま
たは単一の方向の前後θに制限しなければならない。
【0006】
【発明が解決しようとする課題】上記したように、現在
知られている雑音や複数の音源から目的音だけを抽出す
る方法の中で、ユーザの音声入力可能な方向が比較的広
くなるのは、(ハ)のビームフォーマを利用したマイク
ロホンアレイによる雑音抑圧方法、即ちビームフォーマ
型雑音除去方法である。
【0007】しかし、この(ハ)の方法でも、目的音の
入力可能な方向は単一の方向かまたは単一の方向の前後
θに制限しなければならないため、ユーザの音声入力方
向(発声方向)もある程度の制約を受ける。つまり、ビ
ームフォーマ型雑音除去機能を有効に作用させるには、
ユーザの発声方向をある角度範囲に制限する必要があ
る。ところが、ユーザの発声方向をある角度範囲に制限
することは容易ではない。
【0008】本発明は上記事情を考慮してなされたもの
でその目的は、マイクロホンと話者の位置関係を話者に
意識させずに制限できるようにすることにより、雑音除
去機能を有効に作用させることができる雑音除去機能付
き音声入力装置及び音声入出力装置を提供することにあ
る。
【0009】本発明の他の目的は、マイクロホンと雑音
源となるスピーカの位置関係を制限できるようにするこ
とにより、雑音除去機能を有効に作用させることができ
る雑音除去機能付き音声入力装置及び音声入出力装置を
提供することにある。
【0010】
【課題を解決するための手段】本発明は、音声を入力す
るための少なくとも2本のマイクロホンと、このマイク
ロホンにより入力された音声に含まれる雑音を除去する
ためのビームフォーマ型雑音除去手段とを備えた雑音除
去機能付き音声入力装置において、上記少なくとも2本
のマイクロホンが面対称となる対称面上に疑似マイクロ
ホンを設けたことを特徴とする。
【0011】上記少なくとも2本のマイクロホンが面対
称となる対称面上の位置は、ビームフォーマ型雑音除去
手段が効率よく機能する(角度範囲となる)位置である
ことから、当該対象面上に疑似マイクロホンを設けるこ
とにより、当該雑音除去手段が効率よく機能する位置で
ユーザに発声させることができ、より雑音の少ない音声
を入力することができる。
【0012】このため、上記構成の音声入力装置を音声
認識装置の入力部に適用するならば、雑音の少ない音声
を音声認識装置(の音声認識手段)に入力することがで
きるので、認識性能の向上が図れる。同様に、上記構成
の音声入力装置をハンズフリー電話装置の入力部に適用
するならば、ユーザは雑音環境下でも大きな声を出さな
くても、雑音の少ない明瞭な音声で通話することができ
る。
【0013】また本発明は、音声を入力するための少な
くとも2本のマイクロホンと、このマイクロホンにより
入力された音声に含まれる雑音を除去するためのビーム
フォーマ型雑音除去手段と、音響出力用のスピーカとを
備えた雑音除去機能付き音声入出力装置において、上記
少なくとも2本のマイクロホンが面対称となる対称面上
以外に上記スピーカを配置したことを特徴とする。
【0014】このように、上記少なくとも2本のマイク
ロホンが面対称となる対称面上以外の位置にスピーカを
配置することにより、音声とスピーカから出力される音
波との分離が容易になり、当該スピーカから出力される
音波を雑音として、入力された音声信号から効率よく除
去することができる。また、複数のスピーカを配置する
場合には、当該複数のスピーカを、上記少なくとも2本
のマイクロホンが面対称となる対称面に対して面対称と
ならない位置に配置すればよい。
【0015】また本発明は、音声を入力するための2本
のマイクロホンと、このマイクロホンにより入力された
音声に含まれる雑音を除去するためのビームフォーマ型
雑音除去手段と、音響出力用のスピーカとを備えた雑音
除去機能付き音声入出力装置において、上記2本のマイ
クロホンが面対称となる対称面上に疑似マイクロホンを
設けると共に、上記2本のマイクロホンと疑似マイクロ
ホンが作る三角形の外側に上記スピーカを配置すること
で、雑音除去手段が効率よく機能する位置でユーザに発
声させることができるだけでなく、ユーザが発声した音
声とスピーカから出力された音波との分離を容易にした
ことを特徴とする。ここで、上記スピーカを、単に2本
のマイクロホンと疑似マイクロホンが作る三角形の外側
の位置ではなく、2本のマイクロホンと疑似マイクロホ
ンが作る平面以外に配置するならば一層効果が上がる。
【0016】また本発明は、音声を入力するための少な
くとも2本のマイクロホンと、このマイクロホンにより
入力された音声に含まれる雑音を除去するためのビーム
フォーマ型雑音除去手段とを備えた雑音除去機能付き音
声入力装置において、人を含む動物を模した模擬動物体
を備え、この模擬動物体の耳に相当する位置に上記少な
くとも2本のマイクロホンを配置したことを特徴とす
る。ここで、スピーカを加えた音声入出力装置を実現す
る場合には、当該スピーカを上記模擬動物体の口に相当
する位置に配置するとよい。
【0017】このような構成においては、話者の口から
上記少なくとも2つのマイクロホンまでの距離と角度を
等しくすることが可能となり、雑音除去手段が雑音除去
を行うために都合の良い条件を満たすことができる。ま
た、スピーカを備えた構成では、当該スピーカを模擬動
物体の口に相当する位置に配置し、ガイダンスなどを出
力することにより、やはり雑音除去手段が雑音除去を行
うために都合の良い条件を満たすことができる。
【0018】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
【0019】[第1の実施形態]まず、本発明の第1の
実施形態に係る雑音除去機能付き音声入力装置につい
て、複数のマイクロホン、例えば2本のマイクロホンを
利用したビームフォーマ型雑音除去技術を適用する場合
を例に説明する。
【0020】一般にビームフォーマ型雑音除去技術を使
用する場合、複数本(ここでは2本)のマイクロホン
(以下、マイクと略称する)に同じ音声が入力されるこ
とが望ましい。ところが、ユーザインタフェースの観点
から考えると、マイクが複数本あると、ユーザ(話者)
はどのマイクに向かって発声すべきなのか、戸惑ってし
まう。特に、複数本のマイク相互間の距離が一定以上離
れている場合、ユーザは、いずれか1つのマイクに向か
って発声しやすい。つまり、ユーザに対し、複数のマイ
クに同じ音声が入力される方向に発声させることは困難
であるという問題がある。
【0021】図1は、このような問題を解決するための
雑音除去機能付き音声入力装置の概略構成を示すブロッ
ク図である。図1の構成の特徴は、第1のマイク101
及び第2のマイク102の2本のマイクと、ビームフォ
ーマ型の雑音除去部104とを備えた雑音除去機能付き
音声入力装置において、マイク101とマイク102と
が面対称となる平面(つまり対称面)X上に疑似マイク
103を配置したことにある。
【0022】このような配置では、ユーザ(話者)は、
ビームフォーマ型雑音除去技術を有効に機能させる角度
範囲を何ら意識することなく、疑似マイク103に向か
って音声を発声する。
【0023】マイク101及び102は入力音声を電気
信号に変換して、ビームフォーマ型の雑音除去部104
に音声信号を出力する。このマイク101及び102と
雑音除去部104の電気的な接続関係は従来と同様であ
る。
【0024】マイク101及び102から雑音除去部1
04に入力された音声信号に含まれている雑音は、文献
1(電子情報通信学会編:音響システムとデジタル処
理)、或いは文献2(Henkin著:Adaptive Filter Theo
ry(Plentice Hall))に記載されているような(一般化
サイドローブキャンセラ(GSC)、フロスト型ビーム
フォーマ、参照信号法などを利用した)適応ビームフォ
ーマ処理、更には文献3(宝珠山他:“ブロッキング行
列にリーク適応フィルタを用いたロバスト一般化サイド
ローブキャンセラ”、電子通信学会論文誌 A Vol.J79-A
N0.9 pp1516-1524(1996.9))に記載されている適応ビ
ームフォーマ処理、或いは特開平9−9794号公報に
記載されている複数ビームフォーマを用いた処理により
除去(抑圧)される。
【0025】このように、ビームフォーマ型の雑音除去
部104にて目的音声から雑音が除去されることによ
り、雑音の少ない音声を、音声認識装置やテレビ会議装
置などの音声利用機器に入力することが可能となる。
【0026】このように本実施形態においては、マイク
101とマイク102とが面対称となる平面X上に、即
ち雑音除去部104が効率よく機能する(角度範囲とな
る)位置に疑似マイク103を配置することにより、雑
音除去部104が効率よく機能する位置でユーザに発声
させることができ、より雑音の少ない音声を音声認識装
置やテレビ会議装置などの音声利用機器に入力すること
ができる。
【0027】以上はマイクが2本の場合について説明し
たが、これに限るものではなく、3本以上のマイクを使
用する場合には、その3本以上のマイクが面対称となる
平面に疑似マイク103を配置すればよい。なお、3本
以上のマイクが面対称となる平面(対称面)が存在する
ためには、マイクの数が2n(nは2以上の整数)の場
合、即ちn組のマイク対を使用する場合には、ある基準
面に対して各マイク対の位置関係が面対称であればよ
く、当該基準面が対称面となる。また、マイクの数が2
n−1の場合、即ちn−1組のマイク対と1本のマイク
の合計2n−1本を使用する場合には、ある基準面に対
してn−1組の各マイク対の位置関係が面対称で、且つ
残りの1本のマイクが当該基準面に位置していればよ
く、当該基準面が対称面となる。
【0028】[第2の実施形態]次に、図1の音声入力
装置を音声認識装置の入力部に適用した本発明の第2の
実施形態について図面を参照して説明する。図2は同実
施形態に係る音声認識装置の概略構成を示すブロック図
であり、図1と同一部分には同一符号を付してある。
【0029】図2の音声認識装置は、図1の構成の音声
入力装置210と、当該音声入力装置210(内の雑音
除去部104)から入力される音声の認識処理を行って
認識結果を出力する音声認識部220とから構成されて
いる。
【0030】図3は音声認識部220の構成を示すブロ
ック図である。音声認識部220は、音声入力部22
1、音響分析部222、モデル照合部223、音声モデ
ル記憶部224、認識語彙入力部225及び認識結果出
力部226の周知の構成を有している。
【0031】音声認識部220において、音声入力装置
210内の雑音除去部104から出力される雑音が除去
された音声は、音声入力部221により音響分析部22
2に入力され、当該音響分析部222で特徴パラメータ
に変換される。音声認識に使用される代表的な特徴パラ
メータとしては、バンドパスフィルタ(BPF)やフー
リエ変換(FFT)によって求めることができるパワー
スペクトル、或いはLPC(線形予測)分析によって求
めたケプストラム係数などがよく用いられるが、ここで
はその特徴パラメータの種類は問わない。
【0032】音響分析部222は求めた特徴パラメータ
系列をモデル照合部223に出力する。モデル照合部2
23は、認識語彙入力部225から入力された認識語彙
に従って予め作成して音声モデル記憶部224に記憶し
ておいた認識対象音声の各音声モデルと特徴パラメータ
系列の類似度或いは距離を求める演算を行う。認識語彙
入力部225は、音声モデルを作成するのに必要な読み
等の情報をキーボードやファイルから入力することで実
現することができる。
【0033】モデル照合部223の照合方法としては、
音声モデルも特徴パラメータ系列で表現しておき、DP
(動的計画)法で音声モデルの特徴パラメータ系列と入
力音声の特徴パラメータ系列の距離を求める手法や、H
MM(隠れマルコフモデル)を用いて音声モデルを表現
しおき、入力音声の特徴パラメータ系列が入力されたと
きの各音声モデルの確率を計算する手法などが広く使用
されている。但し本実施形態では、その手法は問わな
い。モデル照合部223でのモデル照合の結果は認識結
果出力部226から出力される。
【0034】本実施形態においては、図1の構成の音声
入力装置(210)を音声認識装置の入力部に適用した
ことにより、雑音除去部104が効率よく機能する位置
でユーザに発声させることができ、雑音の少ない音声を
音声認識装置(の音声認識部220)に入力することが
できるので、認識性能の向上が図れる。
【0035】[第3の実施形態]次に、図1の音声入力
装置をハンズフリー電話装置の入力部に適用した本発明
の第3の実施形態について図面を参照して説明する。図
4は同実施形態に係るハンズフリー電話装置の概略構成
を示すブロック図であり、図1と同一部分には同一符号
を付してある。
【0036】図4のハンズフリー電話装置は、図1の構
成の音声入力装置310と、音声の送受信を行う電話装
置本体320であって、当該音声入力装置310により
入力される音声を受けて送信する電話装置本体320と
から構成されている。
【0037】図4の構成において、音声入力装置310
内の雑音除去部304から出力される雑音が除去された
音声は電話装置本体320に入力される。電話装置本体
320は、この雑音が除去された入力音声を送話先に送
信する。これにより、雑音の少ない明瞭な音声で通話す
ることができる。
【0038】このように本実施形態においては、図1の
構成の音声入力装置をハンズフリー電話装置の入力部に
適用することにより、ユーザは雑音環境下でも大きな声
を出さなくても、雑音の少ない明瞭な音声で通話するこ
とができる。
【0039】[第4の実施形態]次に、本発明の第4の
実施形態に係る雑音除去機能付き音声入出力装置につい
て、音声入力部に前記第1の実施形態と同様に2本のマ
イクを利用したビームフォーマ型雑音除去技術を適用
し、音響出力部にスピーカを備えた構成を適用する場合
を例に説明する。
【0040】前記したように、ビームフォーマ型雑音除
去技術を使用する場合には、複数本(ここでは2本)の
マイクに同じ音声が入力されることが望ましい。また、
複数本のマイクに同じ雑音が入力されることは望ましく
ない。特に、本雑音除去技術を、スピーカからガイダン
スや音楽を出力する機能を持つシステム(音声入出力装
置)の入力部に適用する場合には、当該スピーカから出
力される音波が雑音となる可能性があるため、つまり当
該スピーカが雑音源となるため、その影響をなくすよう
にする必要がある。
【0041】図5は、このような問題を解決するための
雑音除去機能付き音声入出力装置の概略構成を示すブロ
ック図であり、図1と同一部分には同一符号を付してあ
る。
【0042】図5の構成の特徴は、音声入力部に第1の
マイク101及び第2のマイク102の2本のマイク
と、ビームフォーマ型の雑音除去部104とを備えると
共に、音響出力部にスピーカ401を備えた雑音除去機
能付き音声入出力装置において、マイク101とマイク
102とが面対称となる平面X以外の位置にスピーカ4
01を配置したことにある。ここでスピーカ401は、
ガイダンスや音楽の音響出力に用いられるもので、音声
入力部側と必ずしも関連がある必要はない。
【0043】このような配置では、雑音除去部104
は、マイク101及び102により入力された音声信号
から、スピーカ401により出力された雑音を効率よく
除去する。
【0044】もし、スピーカ401が平面X上に置かれ
ている場合には、雑音除去部104では、ユーザが発声
した音声とスピーカ401から出力された音波を区別で
きないために、当該スピーカ401から出力された音波
を音声信号から除去することが困難となる。
【0045】このように本実施形態においては、スピー
カ401を、マイク101とマイク102とが面対称と
なる平面X上以外に配置することにより、雑音除去部1
04では、マイク101及び102により入力される音
声とスピーカ401から出力される音波との分離が容易
になり、当該スピーカ401から出力される音波を雑音
として、入力された音声信号から効率よく除去すること
ができる。
【0046】以上はマイクが2本の場合について説明し
たが、3本以上の場合にも同様に実施できる。
【0047】[第5の実施形態]次に、本発明の第5の
実施形態に係る雑音除去機能付き音声入出力装置につい
て、音声入力部に複数のマイク、例えば2本のマイクを
利用したビームフォーマ型雑音除去技術を適用し、音響
出力部に複数のスピーカ、例えば2個のスピーカを備え
た構成を適用する場合を例に説明する。
【0048】前記したように、ビームフォーマ型雑音除
去技術を使用する場合には、複数本(ここでは2本)の
マイクに同じ音声が入力されることが望ましい。また、
複数本のマイクに同じ雑音が入力されることは望ましく
ない。特に、本雑音除去技術を、複数(ここでは2個)
のスピーカからガイダンスや音楽を出力する機能を持つ
システム(音声入出力装置)の入力部に適用する場合に
は、当該スピーカから出力される音波が雑音となる可能
性があるため、つまり当該スピーカが雑音源となるた
め、その影響をなくすようにする必要がある。
【0049】図6は、このような問題を解決するための
雑音除去機能付き音声入出力装置の概略構成を示すブロ
ック図であり、図1と同一部分には同一符号を付してあ
る。
【0050】図6の構成の特徴は、音声入力部に第1の
マイク101及び第2のマイク102の2本のマイク
と、ビームフォーマ型の雑音除去部104とを備えると
共に、音響出力部に第1のスピーカ501及び第2のス
ピーカ502を備えた音声入出力装置において、スピー
カ501とスピーカ502とを、マイク101とマイク
102とが面対称となる平面Xに対して面対称とならな
い位置に配置したことにある。
【0051】このような配置では、雑音除去部104
は、マイク101及び102により入力された音声信号
から、スピーカ501及び502により出力された雑音
を効率よく除去する。
【0052】もし、スピーカ501とスピーカ502と
が平面Xに対して面対称の位置に置かれている場合に
は、雑音除去部104では、ユーザが発声した音声とス
ピーカ501及び502から出力された音波を区別でき
ないために、当該スピーカ501及び502から出力さ
れた音波を音声信号から除去することが困難となる。
【0053】このように本実施形態においては、スピー
カ511とスピーカ502とを、マイク101とマイク
102とが面対称となる平面Xに対して面対称とならな
い位置に配置することにより、雑音除去部104では、
マイク101及び102により入力される音声とスピー
カ501及び502から出力された音波との分離が容易
になり、当該スピーカ501及び502から出力される
音波を雑音として、入力された音声信号から効率よく除
去することができる。
【0054】以上はマイクが2本、スピーカが2個の場
合について説明したが、マイクまたはスピーカの少なく
とも一方が3つ以上の場合にも同様に実施できる。
【0055】[第6の実施形態]次に、本発明の第6の
実施形態に係る雑音除去機能付き音声入出力装置につい
て、音声入力部に2本のマイクを利用したビームフォー
マ型雑音除去技術を適用し、音響出力部にスピーカを備
えた構成を適用する場合を例に説明する。
【0056】ビームフォーマ型雑音除去技術を使用する
場合には、2本のマイクに同じ音声が入力されることが
望ましい。また、2本のマイクに同じ雑音が入力される
ことは望ましくない。特に、本雑音除去技術を、スピー
カからガイダンスや音楽を出力する機能を持つシステム
(音声入出力装置)の入力部に適用する場合には、当該
スピーカから出力される音波が雑音となる可能性がある
ため、つまり当該スピーカが雑音源となるため、その影
響をなくすようにする必要がある。
【0057】図7は、このような問題を解決するための
雑音除去機能付き音声入出力装置の概略構成を示すブロ
ック図であり、図1と同一部分には同一符号を付してあ
る。
【0058】図7の構成の特徴は、音声入力部に第1の
マイク101及び第2のマイク102の2本のマイク
と、ビームフォーマ型の雑音除去部104とを備えると
共に、音響出力部にスピーカ601を備えた雑音除去機
能付き音声入出力装置において、マイク101とマイク
102とが面対称となる平面X上に疑似マイク603を
配置すると共に、マイク101とマイク102と疑似マ
イク603とが作る三角形Yの外側にスピーカ601を
配置したことにある。
【0059】このような配置では、ユーザは、ビームフ
ォーマ型雑音除去技術を有効に機能させる角度範囲を何
ら意識することなく、当該疑似マイク603に向かって
音声を発声できる。
【0060】また雑音除去部104は、マイク101及
び102により入力された音声信号から、スピーカ60
1により出力された雑音を効率よく除去する。
【0061】もし、スピーカ601が上記三角形Y内に
置かれている場合は、ユーザが発声した音声とスピーカ
601から出力された音波を区別することが難しくなる
ために、当該スピーカ601から出力された音波を音声
信号から除去することが困難となる。
【0062】このように本実施形態においては、スピー
カ601を、2本のマイク101及び102と疑似マイ
ク603が作る三角形Y外に配置することにより、雑音
除去部104では、マイク101及び102により入力
される音声とスピーカ601から出力される音波との分
離が容易になり、当該スピーカ601から出力される音
波を雑音として、入力された音声信号から効率よく除去
することができる。
【0063】[第7の実施形態]次に、本発明の第7の
実施形態に係る雑音除去機能付き音声入出力装置につい
て、前記第6の実施形態と同様に、音声入力部に2本の
マイクを利用したビームフォーマ型雑音除去技術を適用
し、音響出力部にスピーカを備えた構成を適用する場合
を例に、図8のブロック構成図を参照して説明する。な
お、図7と同一部分には同一符号を付してある。
【0064】図8の音声入出力装置が図7の音声入出力
装置と異なる点は、スピーカ601が、単にマイク10
1とマイク102と疑似マイク603とが作る三角形Y
の外側だけでなく、マイク101とマイク102と疑似
マイク603とが作る平面Z外に配置されることにあ
る。
【0065】このような配置では、雑音除去部104
は、マイク101及び102により入力された音声信号
から、スピーカ601により出力された雑音を前記第6
の実施形態より更に効率よく除去する。
【0066】もし、スピーカ601が上記平面Z上に置
かれている場合は、ユーザが発声した音声とスピーカ6
01から出力された音波を区別することが難しくなるた
めに、当該スピーカ601から出力された音波を音声信
号から除去することが困難となる。
【0067】このように本実施形態においては、スピー
カ601を、2本のマイク101及び102と疑似マイ
ク603が作る平面Z外に配置することにより、雑音除
去部104では、マイク101及び102により入力さ
れる音声とスピーカ601から出力される音波との分離
が容易になり、当該スピーカ601から出力される音波
を雑音として、入力された音声信号から効率よく除去す
ることができる。
【0068】なお、以上に述べた第4乃至第7の実施形
態に係る音声入出力装置のいずれかを音声入出力装置搭
載車両に適用することも可能である。
【0069】[第8の実施形態]次に、本発明の第8の
実施形態に係る雑音除去機能付き音声入力装置につい
て、前記第1の実施形態と同様に、複数のマイク、例え
ば2本のマイクを利用したビームフォーマ型雑音除去技
術を適用する場合を例に説明する。
【0070】ビームフォーマ型雑音除去技術を使用する
場合、複数本(ここでは2本)のマイクに同じ音声が入
力されることが望ましい。また、人間を含む動物と対話
をする場合、顔を向かい合わせるのが一般的であり、人
間を含む動物を模した装置に話掛ける場合にも、顔を向
かい合わせて、つまり正対して対話を行うことが多い。
【0071】図9は、このような点を考慮した雑音除去
機能付き音声入力装置の概略構成を示すブロック図であ
る。図9の構成の特徴は、第1のマイク801及び第2
のマイク802の2本のマイクと、ビームフォーマ型の
雑音除去部804とを備えた雑音除去機能付き音声入力
装置において、当該音声入力装置の例えば筐体、或いは
音声入力インタフェース部を動物(人間を含む)の形状
を模した模擬動物体803で構成し、当該模擬動物体8
03の耳803a,803bに当たる位置にマイク80
1とマイク802とをそれぞれ配置したことにある。
【0072】上記した配置では、マイク801及び80
2から入力された音声は電気信号に変換されて、雑音除
去部804に出力される。ここでは、ユーザが模擬動物
体803に話し掛けるのに、特に意識することなく当該
模擬動物体803に顔を向かい合わせることが期待され
る。このため、マイク801及び802を模擬動物体8
03の耳の位置に配置したことにより、ユーザの口と当
該2つのマイク801及び802の位置が雑音除去部8
04での雑音除去に適した(角度範囲となる)位置関係
となり、効率よく雑音を除去することができる。
【0073】このように本実施形態においては、模擬動
物体803の耳803a,803bに相当する位置にマ
イク801,802をそれぞれ配置することにより、話
者の口から当該2つのマイク801,802までの距離
と角度が等しくなり、雑音除去部804が雑音除去を行
うために都合の良い条件を満たすことができ、雑音が効
率よく除去された音声を、音声認識装置やテレビ会議装
置等の音声利用機器に入力することができる。
【0074】[第9の実施形態]次に、本発明の第9の
実施形態に係る雑音除去機能付き音声入出力装置につい
て、音声入力部に前記第8の実施形態と同様に2本のマ
イクを利用したビームフォーマ型雑音除去技術を適用す
るのに加えて、音響出力部にスピーカを備えた構成を適
用する場合を例に説明する。
【0075】ビームフォーマ型雑音除去技術を使用する
場合、マイクから見たときの音声信号源(ここではユー
ザの口)と雑音源(ここではスピーカ)の方向が異なっ
ていることが望ましい。また、人間を含む動物と対話を
する場合、顔を向かい合わせるのが一般的であり、人間
を含む動物を模した装置に話掛ける場合にも、顔を向か
い合わせて対話を行う場合が多い。
【0076】図10は、このような点を考慮した雑音除
去機能付き音声入出力装置の概略構成を示すブロック図
であり、図9と同一部分には同一符号を付してある。図
10の構成の特徴は、音声入力部に第1のマイク801
及び第2のマイク802の2本のマイクと、ビームフォ
ーマ型の雑音除去部804とを備えると共に、音響出力
部にスピーカ901を備えた雑音除去機能付き音声入出
力装置において、当該音声入出力装置の例えば筐体、或
いは音声入力インタフェース部を動物(人間を含む)の
形状を模した模擬動物体803で構成し、当該模擬動物
体803の耳803a,803bに当たる位置にマイク
801とマイク802とをそれぞれ配置すると共に、当
該模擬動物体803の口803cに当たる位置にスピー
カ901を配置したことにある。
【0077】上記した配置では、マイク801及び80
2から入力された音声は電気信号に変換されて、雑音除
去部804に出力される。ここでは、ユーザが模擬動物
体803に話し掛けるのに、特に意識することなく当該
模擬動物体803に顔を向かい合わせることが期待され
る。
【0078】ユーザが模擬動物体803に対して顔を向
かい合わせた場合には、当該模擬動物体803の口80
3cの位置に設けられたスピーカ901とユーザ(つま
り話者)の口の位置が、当該模擬動物体803の耳80
3a,803bの位置に設けられたマイク801,80
2から同一方向になる可能性が小さく、雑音除去部80
4での雑音除去に適した位置関係となる。これにより雑
音除去部804では、効率よく雑音を除去することがで
きるまた、人は相手が話しているときは話さない傾向が
あるので、模擬動物体803の口303cの位置に設け
られたスピーカ901からガイダンスなどを出力するこ
とにより、そのガイダンスなどの出力期間中はユーザの
発声を抑制することができる。これにより、スピーカ9
01からのガイダンスなどの音声出力とユーザの発声が
同時になることを防ぐこともできる。
【0079】このように本実施形態においては、模擬動
物体803の耳803a,803bに相当する位置にマ
イク801,802をそれぞれ配置すると共に、当該模
擬動物体803の口803cの位置にスピーカ901配
置し、このスピーカ901からガイダンスなどを出力す
る構成とすることにより、雑音除去部804が雑音除去
を行うために都合の良い条件を満たすことができ、雑音
が効率よく除去された音声を、音声認識装置やテレビ会
議装置等の音声利用機器に入力することができる。
【0080】
【発明の効果】以上詳述したように本発明によれば、疑
似マイクロホンという技術思想を導入したことにより、
少なくとも2本のマイクロホンと話者の位置関係を話者
に意識させずに制限でき、雑音除去機能を有効に作用さ
せることができる。
【0081】また本発明によれば、少なくとも2本のマ
イクロホンに対し、雑音源となるスピーカの配置位置を
考慮して、マイクロホンとスピーカの位置関係を制限で
きるようにしたとにより、マイクロホンにより入力され
る音声とスピーカから出力される音波との分離が容易と
なり、雑音除去機能を有効に作用させることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る雑音除去機能付
き音声入力装置の概略構成を示すブロック図。
【図2】本発明の第2の実施形態に係る雑音除去機能付
き音声入力装置を備えた音声認識装置の概略構成を示す
ブロック図。
【図3】図2中の音声認識部220のブロック構成図。
【図4】本発明の第3の実施形態に係る雑音除去機能付
き音声入力装置を備えたハンズフリー電話装置の概略構
成を示すブロック図。
【図5】本発明の第4の実施形態に係る雑音除去機能付
き音声入出力装置の概略構成を示すブロック図。
【図6】本発明の第5の実施形態に係る雑音除去機能付
き音声入出力装置の概略構成を示すブロック図。
【図7】本発明の第6の実施形態に係る雑音除去機能付
き音声入出力装置の概略構成を示すブロック図。
【図8】本発明の第7の実施形態に係る雑音除去機能付
き音声入出力装置の概略構成を示すブロック図。
【図9】本発明の第8の実施形態に係る雑音除去機能付
き音声入力装置の概略構成を示すブロック図。
【図10】本発明の第9の実施形態に係る雑音除去機能
付き音声入出力装置の概略構成を示すブロック図。
【符号の説明】
101,102,801,802…マイク(マイクロホ
ン) 103,603…疑似マイク 104,804…雑音除去部(ビームフォーマ型雑音除
去部) 210,310…音声入力装置 220…音声認識部 320…電話装置本体 401,501,502,601,901…スピーカ 803…模擬動物体 X,Z…平面 Y…三角形
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04R 3/00 320 5/027 A (72)発明者 小野木 智宏 東京都青梅市新町3丁目3番地の1 東芝 コンピュータエンジニアリング株式会社内 Fターム(参考) 5D011 AA02 AB12 AB13 5D015 DD02 EE05 5D018 BB23 5D020 BB07

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力するための少なくとも2本の
    マイクロホンと、前記マイクロホンにより入力された音
    声に含まれる雑音を除去するためのビームフォーマ型雑
    音除去手段とを備えた雑音除去機能付き音声入力装置に
    おいて、 前記少なくとも2本のマイクロホンが面対称となる対称
    面上に疑似マイクロホンを設けたことを特徴とする雑音
    除去機能付き音声入力装置。
  2. 【請求項2】 請求項1記載の雑音除去機能付き音声入
    力装置と、 前記音声入力装置により入力された音声を認識するため
    の音声認識手段とを具備することを特徴とする音声認識
    装置。
  3. 【請求項3】 請求項1記載の雑音除去機能付き音声入
    力装置と、 音声の送受信を行う電話装置本体であって、前記音声入
    力装置により入力された音声を送話先に送信する電話装
    置本体とを具備することを特徴とするハンズフリー電話
    装置。
  4. 【請求項4】 音声を入力するための少なくとも2本の
    マイクロホンと、前記マイクロホンにより入力された音
    声に含まれる雑音を除去するためのビームフォーマ型雑
    音除去手段と、音響出力用のスピーカとを備えた雑音除
    去機能付き音声入出力装置において、 前記少なくとも2本のマイクロホンが面対称となる対称
    面上以外に前記スピーカを配置したことを特徴とする雑
    音除去機能付き音声入出力装置。
  5. 【請求項5】 音声を入力するための少なくとも2本の
    マイクロホンと、前記マイクロホンにより入力された音
    声に含まれる雑音を除去するためのビームフォーマ型雑
    音除去手段と、少なくとも2個の音響出力用のスピーカ
    とを備えた雑音除去機能付き音声入出力装置において、 前記少なくとも2本以上のマイクロホンが面対称となる
    対称面に対して面対称から外れる位置に前記少なくとも
    2個のスピーカを配置したことを特徴とする雑音除去機
    能付き音声入出力装置。
  6. 【請求項6】 音声を入力するための2本のマイクロホ
    ンと、前記マイクロホンにより入力された音声に含まれ
    る雑音を除去するためのビームフォーマ型雑音除去手段
    と、音響出力用のスピーカとを備えた雑音除去機能付き
    音声入出力装置において、 前記2本のマイクロホンが面対称となる対称面上に疑似
    マイクロホンを設けると共に、 前記2本のマイクロホンと前記疑似マイクロホンが作る
    三角形の外側に前記スピーカを配置したことを特徴とす
    る雑音除去機能付き音声入出力装置。
  7. 【請求項7】 音声を入力するための2本のマイクロホ
    ンと、前記マイクロホンにより入力された音声に含まれ
    る雑音を除去するためのビームフォーマ型雑音除去手段
    と、音響出力用のスピーカとを備えた雑音除去機能付き
    音声入出力装置において、 前記2本のマイクロホンが面対称となる対称面上に疑似
    マイクロホンを設けると共に、 前記2本のマイクロホンと前記疑似マイクロホンが作る
    平面上以外に前記スピーカを配置したことを特徴とする
    雑音除去機能付き音声入出力装置。
  8. 【請求項8】 音声を入力するための少なくとも2本の
    マイクロホンと、前記マイクロホンにより入力された音
    声に含まれる雑音を除去するためのビームフォーマ型雑
    音除去手段とを備えた雑音除去機能付き音声入力装置に
    おいて、 人を含む動物を模した模擬動物体を備え、 前記模擬動物体の耳に相当する位置に前記少なくとも2
    本のマイクロホンを配置したことを特徴とする雑音除去
    機能付き音声入力装置。
  9. 【請求項9】 音声を入力するための少なくとも2本の
    マイクロホンと、前記マイクロホンにより入力された音
    声に含まれる雑音を除去するためのビームフォーマ型雑
    音除去手段と、音響出力用のスピーカとを備えた雑音除
    去機能付き音声入力装置において、 人を含む動物を模した模擬動物体を備え、 前記模擬動物体の耳に相当する位置に前記少なくとも2
    本のマイクロホンを配置し、且つ前記模擬動物体の口に
    相当する位置に前記スピーカを配置したことを特徴とす
    る雑音除去機能付き音声入力装置。
  10. 【請求項10】 音声を入力するための少なくとも2本
    のマイクロホンと、前記マイクロホンにより入力された
    音声に含まれる雑音を除去するためのビームフォーマ型
    雑音除去手段と、音響出力用のスピーカとを備えたシス
    テムにおけるマイクロホン・スピーカ配置方法であっ
    て、 前記少なくとも2本のマイクロホンが面対称となる対称
    面上以外に前記スピーカを配置したことを特徴とするマ
    イクロホン・スピーカ配置方法。
  11. 【請求項11】 音声を入力するための少なくとも2本
    のマイクロホンと、前記マイクロホンにより入力された
    音声に含まれる雑音を除去するためのビームフォーマ型
    雑音除去手段と、少なくとも2個の音響出力用のスピー
    カとを備えたシステムにおけるマイクロホン・スピーカ
    配置方法であって、 前記少なくとも2本以上のマイクロホンが面対称となる
    対称面に対して面対称から外れる位置に前記少なくとも
    2個のスピーカを配置したことを特徴とするマイクロホ
    ン・スピーカ配置方法。
  12. 【請求項12】 音声を入力するための2本のマイクロ
    ホンと、前記マイクロホンにより入力された音声に含ま
    れる雑音を除去するためのビームフォーマ型雑音除去手
    段と、音響出力用のスピーカとを備えたシステムにおけ
    るマイクロホン・スピーカ配置方法であって、 前記2本のマイクロホンが面対称となる対称面上に疑似
    マイクロホンを配置すると共に、 前記2本のマイクロホンと前記疑似マイクロホンが作る
    平面上以外に前記スピーカを配置したことを特徴とする
    マイクロホン・スピーカ配置方法。
JP11021308A 1999-01-29 1999-01-29 雑音除去機能付き音声入力装置及び音声入出力装置 Withdrawn JP2000221999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11021308A JP2000221999A (ja) 1999-01-29 1999-01-29 雑音除去機能付き音声入力装置及び音声入出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11021308A JP2000221999A (ja) 1999-01-29 1999-01-29 雑音除去機能付き音声入力装置及び音声入出力装置

Publications (1)

Publication Number Publication Date
JP2000221999A true JP2000221999A (ja) 2000-08-11

Family

ID=12051531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11021308A Withdrawn JP2000221999A (ja) 1999-01-29 1999-01-29 雑音除去機能付き音声入力装置及び音声入出力装置

Country Status (1)

Country Link
JP (1) JP2000221999A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7567678B2 (en) 2003-05-02 2009-07-28 Samsung Electronics Co., Ltd. Microphone array method and system, and speech recognition method and system using the same
JP2017011754A (ja) * 2016-09-14 2017-01-12 ソニー株式会社 耳孔装着型収音装置、信号処理装置、収音方法
JP2021033030A (ja) * 2019-08-23 2021-03-01 沖電気工業株式会社 音声処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7567678B2 (en) 2003-05-02 2009-07-28 Samsung Electronics Co., Ltd. Microphone array method and system, and speech recognition method and system using the same
JP2017011754A (ja) * 2016-09-14 2017-01-12 ソニー株式会社 耳孔装着型収音装置、信号処理装置、収音方法
JP2021033030A (ja) * 2019-08-23 2021-03-01 沖電気工業株式会社 音声処理装置

Similar Documents

Publication Publication Date Title
US10535362B2 (en) Speech enhancement for an electronic device
KR101444100B1 (ko) 혼합 사운드로부터 잡음을 제거하는 방법 및 장치
US10269369B2 (en) System and method of noise reduction for a mobile device
JP5156260B2 (ja) 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム
KR101606966B1 (ko) 공간 선택적 오디오 증강을 위한 시스템들, 방법들, 장치들, 및 컴퓨터 판독가능 매체들
EP1349419A2 (en) Orthogonal circular microphone array system and method for detecting three-dimensional direction of sound source using the same
US20060271370A1 (en) Mobile two-way spoken language translator and noise reduction using multi-directional microphone arrays
JP5929786B2 (ja) 信号処理装置、信号処理方法及び記憶媒体
US20190138603A1 (en) Coordinating Translation Request Metadata between Devices
JPH09503889A (ja) 音声相殺式送話システム
JP2014174255A5 (ja)
CN115482830A (zh) 语音增强方法及相关设备
JP5130298B2 (ja) 補聴器の動作方法、および補聴器
JPH09233198A (ja) 全二重音声会議電話のためのソフトウエアベースのブリッジ方法及び装置
Okuno et al. Robot audition: Missing feature theory approach and active audition
JP2005303574A (ja) 音声認識ヘッドセット
Nakadai et al. Towards new human-humanoid communication: listening during speaking by using ultrasonic directional speaker
JP2000221999A (ja) 雑音除去機能付き音声入力装置及び音声入出力装置
Yamamoto et al. Design and implementation of a robot audition system for automatic speech recognition of simultaneous speech
US20090285422A1 (en) Method for operating a hearing device and hearing device
WO2019155660A1 (ja) 車載用音響装置
Okuno et al. Computational auditory scene analysis and its application to robot audition
Kim et al. Hybrid probabilistic adaptation mode controller for generalized sidelobe cancellers applied to multi-microphone speech enhancement
Takada et al. Sound source separation using null-beamforming and spectral subtraction for mobile devices
Ichikawa et al. Effective speech suppression using a two-channel microphone array for privacy protection in face-to-face sales monitoring

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051104

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20060809

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060814